1. EducationMathStatisticsStatistics dan Histogram
Buku Kerja Statistik Untuk Dummies dengan Praktek Online, Edisi ke-2

Oleh Deborah J. Rumsey

Histogram adalah grafik batang yang dibuat untuk data kuantitatif. Karena datanya numerik, Anda membaginya ke dalam grup tanpa meninggalkan celah di antaranya (sehingga bilah terhubung). Sumbu Y menunjukkan frekuensi (jumlah) atau frekuensi relatif (persen) dari data yang termasuk dalam setiap kelompok.

Cara membuat histogram

Untuk membuat histogram, pertama-tama Anda membagi data menjadi beberapa grup dengan panjang yang wajar. Jumlahkan nilai-nilai dalam set data yang termasuk dalam setiap kelompok (dengan kata lain, buat tabel frekuensi). Jika suatu titik data jatuh pada batas, buat keputusan tentang kelompok mana yang akan dimasukkan, pastikan Anda tetap konsisten (selalu tempatkan di bagian yang lebih tinggi dari keduanya, atau selalu tempatkan di bagian yang lebih rendah dari keduanya). Buat grafik batang, menggunakan grup dan frekuensinya - histogram frekuensi.

Jika Anda membagi frekuensi dengan ukuran sampel total, Anda mendapatkan persentase yang termasuk dalam setiap kelompok. Tabel yang menunjukkan grup dan persennya adalah tabel frekuensi relatif. Histogram yang sesuai adalah histogram frekuensi relatif.

Anda dapat menggunakan Minitab atau paket perangkat lunak lain untuk membuat histogram, atau Anda dapat membuat histogram dengan tangan. Apa pun itu, pilihan lebar interval Anda (disebut nampan oleh paket komputer) mungkin berbeda dari yang terlihat pada gambar, yang baik-baik saja, asalkan milik Anda terlihat serupa. Dan mereka akan, selama Anda tidak menggunakan jumlah bar yang rendah atau tinggi dan bar Anda memiliki lebar yang sama.

Anda juga dapat memilih titik awal / akhir yang berbeda untuk setiap interval, dan itu juga bagus. Pastikan untuk memberi label segala sesuatu dengan jelas sehingga instruktur Anda dapat melihat apa yang Anda coba lakukan. Dan konsistenlah dengan nilai yang berakhir tepat di perbatasan; selalu menempatkan mereka di pengelompokan yang lebih rendah, atau selalu menempatkan mereka di pengelompokan atas. Namun, jika Anda memiliki pilihan, buat histogram Anda dengan menggunakan paket komputer seperti Minitab. Itu membuat tugas Anda jauh lebih mudah.

Lihat contoh berikut untuk membuat dua jenis histogram.

Skor tes untuk kelas 30 siswa ditunjukkan pada tabel berikut.

Frekuensi histogram dan histogram frekuensi relatif terlihat sama; mereka baru saja selesai menggunakan skala yang berbeda pada sumbu Y.

Frekuensi histogram untuk data skor ditunjukkan pada gambar berikut.

frekuensi histogram

Anda menemukan frekuensi relatif dengan mengambil setiap frekuensi dan membaginya dengan 30 (total ukuran sampel). Frekuensi relatif untuk ketiga kelompok ini adalah 8/30 = 0,27 atau 27%; 16/30 = 0,53 atau 53%; dan 6/30 = 0,20 atau 20%, masing-masing.

Histogram berdasarkan frekuensi relatif terlihat sama dengan histogram (dari data yang sama). Satu-satunya perbedaan adalah label pada sumbu Y.

Memahami histogram

Histogram memberi Anda informasi umum tentang tiga fitur utama data kuantitatif (numerik) Anda: bentuk, pusat, dan sebaran.

Bentuk histogram ditunjukkan oleh pola umumnya. Banyak pola yang mungkin, dan ada yang umum, termasuk yang berikut:

  • Berbentuk lonceng: Tampak seperti bel - benjolan besar di tengah dan ekor yang turun di setiap sisi dengan laju yang sama. (Gambar a) Miring ke kanan: Sebagian besar data mengarah ke kiri, dengan beberapa pengamatan lebih besar membuntuti ke kanan. (Gambar b) Miring ke kiri: Sebagian besar data mengarah ke kanan, dengan beberapa pengamatan kecil tertinggal di sebelah kiri. (Gambar c) Seragam: Semua bar memiliki ketinggian yang sama. (Gambar d) Bimodal: Dua puncak, atau (Gambar e) Berbentuk U: Bimodal dengan dua puncak di ujung rendah dan tinggi, dengan sedikit data di tengah. (Lihat Gambar 4-1 (Gambar f) Simetris: Terlihat sama di setiap sisi ketika Anda membaginya di tengah; histogram berbentuk lonceng, seragam, dan berbentuk U adalah semua contoh data simetris. (Angka a, d, dan f)
pola histogram umum

Anda dapat melihat bagian tengah histogram dengan dua cara. Salah satunya adalah titik pada sumbu x di mana grafik menyeimbangkan, dengan mempertimbangkan nilai aktual data. Titik ini disebut rata-rata, dan Anda dapat menemukannya dengan mencari titik penyeimbang (bayangkan data berada pada jungkat-jungkit). Cara lain untuk melihat pusat adalah menemukan garis dalam histogram di mana 50 persen data terletak di kedua sisi. Garis ini disebut median, dan mewakili bagian tengah fisik dari kumpulan data. Bayangkan memotong histogram menjadi dua sehingga setengah area terletak di kedua sisi garis.

Spread mengacu pada jarak antara data, baik relatif satu sama lain atau relatif ke beberapa titik pusat. Salah satu cara kasar untuk mengukur spread adalah dengan menemukan rentang, atau jarak antara nilai terbesar dan nilai terkecil. Cara lain adalah mencari jarak rata-rata dari tengah, atau dikenal sebagai standar deviasi. Deviasi standar sulit didapat dengan hanya melihat histogram, tetapi Anda bisa mendapatkan gambaran kasar jika Anda mengambil rentang dibagi dengan 6. Jika ketinggian bar dekat dengan tengah tampak sangat tinggi, itu berarti sebagian besar dari nilai-nilai dekat dengan rata-rata, menunjukkan standar deviasi kecil. Jika bilah tampak pendek, Anda mungkin memiliki standar deviasi yang lebih besar.

Anda dapat melakukan statistik ringkasan aktual untuk menghitung data kuantitatif, tetapi histogram dapat memberi Anda arahan umum untuk menemukan tonggak ini. Dan seperti diagram lingkaran dan grafik batang, tidak semua histogram adil, lengkap, dan akurat. Anda harus tahu apa yang harus dicari untuk mengevaluasinya.

Cara meluruskan data yang miring dengan histogram

Anda perlu membuat pertimbangan khusus untuk kumpulan data yang miring, dalam hal statistik mana yang paling tepat untuk digunakan dan kapan. Anda juga harus menyadari bagaimana menggunakan statistik yang salah dapat memberikan jawaban yang menyesatkan.

Anda dapat menghubungkan rata-rata dan median untuk belajar tentang bentuk data Anda. Memiliki mean dan median mendekati kesetaraan akan menciptakan bentuk yang kira-kira simetris

Rerata dipengaruhi oleh pencilan dalam data, tetapi median tidak. Jika mean dan median dekat satu sama lain, data tidak miring dan kemungkinan tidak mengandung pencilan di satu sisi atau yang lain. Itu berarti bahwa data terlihat hampir sama di setiap sisi tengah, yang merupakan definisi data simetris (lihat a, d, atau f pada gambar sebelumnya).

Fakta bahwa mean dan median yang dekat memberi tahu Anda bahwa data secara simetris dapat digunakan dalam berbagai jenis pertanyaan tes. Misalkan seseorang bertanya kepada Anda apakah datanya simetris, dan Anda tidak memiliki histogram, tetapi Anda memang memiliki mean dan median. Bandingkan dua nilai mean dan median, dan jika keduanya dekat, datanya simetris. Jika tidak, data tidak simetris.

Cara mengenali histogram yang menyesatkan

Pembaca dapat disesatkan oleh histogram dengan cara yang tidak mungkin dilakukan dengan grafik batang. Ingatlah bahwa histogram berkaitan dengan data numerik, bukan data kategorikal, yang berarti Anda harus menentukan bagaimana Anda ingin data numerik dipecah menjadi beberapa kelompok untuk ditampilkan pada sumbu horizontal. Dan bagaimana Anda menentukan pengelompokan tersebut dapat membuat grafik terlihat sangat berbeda. Perhatikan histogram yang menggunakan skala untuk menyesatkan pembaca. Seperti halnya grafik batang, Anda dapat melebih-lebihkan perbedaan dengan menggunakan skala yang lebih kecil pada sumbu vertikal histogram, dan Anda dapat mengecilkan perbedaan dengan menggunakan skala yang lebih besar.