Isi
Kegiatan bisnis, pemerintahan dan akademik hampir selalu membutuhkan pengumpulan dan analisis data. Salah satu cara untuk merepresentasikan data numerik adalah melalui grafik, histogram, dan grafik. Teknik visualisasi ini memungkinkan orang untuk mendapatkan wawasan yang lebih baik tentang masalah dan menyusun solusi. Kesenjangan, kluster dan outlier adalah karakteristik dari set data yang memengaruhi analisis matematika dan mudah terlihat pada representasi visual.
Lubang dalam Data
Kesenjangan merujuk pada area yang hilang dalam kumpulan data. Misalnya, jika percobaan ilmiah mengumpulkan data suhu dalam kisaran 50 derajat Fahrenheit hingga 100 derajat Fahrenheit, tetapi tidak ada yang berkisar antara 70 dan 80 derajat, itu akan merepresentasikan kesenjangan dalam kumpulan data. Sebuah plot garis dari kumpulan data ini akan memiliki tanda "x" untuk suhu antara 50 dan 70 dan lagi antara 80 dan 100, tetapi tidak akan ada apa pun antara 70 dan 80. Para peneliti dapat menggali lebih dalam dan mengeksplorasi mengapa titik-titik data tertentu tidak muncul dalam sampel yang dikumpulkan.
Grup Terisolasi
Cluster adalah kelompok titik data yang terisolasi. Plot garis, yang merupakan salah satu cara untuk mewakili set data, adalah garis dengan tanda "x" yang ditempatkan di atas angka tertentu untuk menggambarkan frekuensi kemunculannya dalam set data. Cluster digambarkan sebagai kumpulan tanda "x" ini dalam interval kecil atau bagian data. Misalnya, jika nilai ujian untuk kelas 10 siswa adalah 74, 75, 80, 72, 74, 75, 76, 86, 88 dan 73, nilai "x" paling banyak pada plot garis adalah 72- interval skor ke-76. Ini akan mewakili cluster data. Perhatikan frekuensi untuk 74 dan 75 adalah dua, tetapi untuk semua skor lainnya, itu adalah satu.
Di Ekstrem
Pencilan adalah nilai ekstrim - titik data yang terletak jauh di luar nilai lain dalam satu set data. Pencilan harus secara signifikan kurang dari atau lebih besar dari sebagian besar angka dalam kumpulan data. Definisi "ekstrim" tergantung pada keadaan dan konsensus para analis yang terlibat dalam penelitian. Pencilan mungkin merupakan titik data yang buruk, juga dikenal sebagai kebisingan, atau mengandung data berharga tentang fenomena yang sedang diselidiki dan metodologi pengumpulan data itu sendiri. Sebagai contoh, jika skor kelas sebagian besar berada di kisaran 70 hingga 80, tetapi beberapa skor berada di bawah 50-an, yang mungkin mewakili outlier.
Menyatukan Semuanya
Kesenjangan, pencilan, dan kelompok dalam kumpulan data dapat memengaruhi hasil analisis matematika. Kesenjangan dan kluster mungkin mewakili kesalahan dalam metodologi pengumpulan data. Misalnya, jika survei telepon hanya melakukan polling kode area tertentu, seperti kompleks perumahan berpenghasilan rendah atau daerah perumahan pinggiran kota kelas atas, dan bukan bagian luas dari populasi, kemungkinan ada kesenjangan dan klaster dalam data tersebut. . Pencilan dapat memiringkan nilai rata-rata atau rata-rata dari suatu kumpulan data. Sebagai contoh, nilai rata-rata atau rata-rata dari suatu kumpulan data yang terdiri dari empat angka - 50, 55, 65 dan 90 - adalah 65. Namun tanpa outlier 90, rata-rata sekitar 57.