Plot sebar adalah alat diagnostik penting dalam arsenal seorang ahli statistik, yang diperoleh dengan membuat grafik dua variabel terhadap satu sama lain. Ini memungkinkan ahli statistik untuk mengamati variabel dan membentuk hipotesis kerja tentang hubungan mereka. Untuk alasan ini, biasanya diambil sebelum analisis regresi dilakukan. Ahli statistik kemudian menguji hipotesis menggunakan analisis regresi dan menentukan tanda dan besarnya hubungan. Selain itu, sebar plot membantu mengidentifikasi outlier - nilai-nilai yang secara abnormal jauh dari sebagian besar data dalam sampel. Menghilangkan pencilan membantu meningkatkan model regresi.
Periksa hubungan negatif antara dua variabel dalam plot pencar. Jika nilai rendah dari variabel pertama sesuai dengan nilai tinggi dari variabel kedua, ada korelasi negatif. Dalam hal ini, garis yang ditarik melalui titik data memiliki kemiringan negatif.
Periksa plot pencar untuk hubungan positif antara variabel. Jika nilai rendah dari variabel pertama dalam plot pencar sesuai dengan nilai rendah yang kedua, dan nilai tinggi dari yang pertama juga sesuai dengan nilai tinggi yang kedua, variabel memiliki korelasi positif. Dalam hal ini, garis yang ditarik melalui titik data memiliki kemiringan positif.
Periksa plot pencar untuk tidak ada hubungan antara variabel. Jika titik data dalam plot sebar didistribusikan secara acak tanpa hubungan yang jelas antara keduanya, mereka tidak memiliki korelasi, atau korelasi kecil, tidak signifikan secara statistik. Dalam hal ini, garis yang ditarik melalui titik data adalah horizontal dengan kemiringan sama dengan nol.
Cocokkan garis melalui titik data dan periksa bentuknya untuk mengukur sifat hubungan antara dua variabel. Garis lurus diartikan sebagai hubungan linier, bentuk melengkung menunjukkan hubungan kuadratik, dan garis yang relatif datar sebelum tiba-tiba menembak ke atas atau ke bawah diartikan sebagai hubungan eksponensial.
Periksa plot pencar untuk pencilan, nilai-nilai yang secara tidak normal jauh dari kelompok titik data. Pencilan mendistorsi hubungan antar variabel. Hilangkan mereka, tetapi hanya jika ketidakhadiran mereka tidak mempengaruhi analisis hubungan antara dua variabel.