NILAI SENTRAL DAN UKURAN PENYIMPANGAN


UKURAN DATA

Ukuran data sampel disebut statistik, ukuran populasi disebut parametrik.
Ada banyak ukuran dalam statistik, seperti kwartil, desil, persentil, rata-rata hitung, rata-rata ukur, rata-rata harmonis, median, modus dan sebagainya. Namun yang dianggap sangat penting untuk diketahui dan yang akan dijelaskan di sini adalah :
·         Mean (rata-rata hitung)
·         Median (nilai tengah)
·         Modus (mode-trend)
Sebelum menjelaskan ukuran-ukuran data tersebut di atas, perlu dipahami dahulu apa yang disebut dengan data tak berkelompok dan data berkelompok.




DATA BERKELOMPOK DAN DATA TAK BERKELOMPOK

Data berkelompok adalah data yang sudah dikelompokkan sehingga besaran data aslinya dapat tidak kelihatan lagi dan berubah menjadi besaran data atau mewakili kelompoknya. Data tak berkelompok tersebut di atas, untuk kemudahan, dapat dijadikan data berkelompok seperti di bawah ini.
Gaji bersih 120 Karyawan PT Karya Guna Abadi (x Rp 1.000)

Kelompok Gaji
Nilai Tengah
Frekuensi
< 500
501-1000
1001-1500
1501-2000
2001-2500
2501-3000
3001-3500
3501-4000
4001-4500
4501-5000
250
750
1.250
1.750
2.250
2.750
3.250
3.750
4.250
4.750
50
15
9
19
9
6
6
1
1
4
Jumlah

120

Data tak berkelompok adalah data yang belum dikelompokkan, masih bebas atau seadanya

Contoh data tak berkelompok:
Gaji bersih 120 Keryawan PT Karya Guna Abadi (x Rp 1.000)
320
560
750
250
430
1250
450
730
2450
1740
1760
450
250
3550
560
280
2450
4650
1760
250
260
280
1790
240
250
1260
1880
280
250
320
4570
2950
560
4500
430
280
560
1250
2450
290
480
3280
470
270
1880
1880
1760
1880
1880
1760
450
560
3250
3350
250
250
450
280
590
1880
430
2450
260
430
560
570
1790
430
560
1970
3350
250
450
250
430
2900
290
1250
3280
470
1260
260
1260
2760
1740
430
2450
560
260
1260
480
2450
580
470
250
3250
560
560
2650
1250
2450
250
1860
4560
4850
1280
430
1940
250
2450
270
1880
450
2450
430
270
2580
1760
2650
440




CARA MENGHITUNG MEAN (RATA-RATA HITUNG)
·         Untuk data tak berkelompok








= rata-rata
å = (sigma) = jumlah
X = nilai data masing-masing sample
n = banyaknya sampel

Contoh (1):
Data: 10  8  11  7  12  15  6  7  5  6  7  9  7  3  7
(n = 15)
Rata-rata dari data tersebut adalah:

= 10+8+11+7+12+15+6+7+5+6+7+9+7+3+7 = 8
                             15

Contoh (2): Dari data PT Karya Guna Abadi di atas.
Gaji bersih 120 Karyawan PT Karya Guna Abadi (x Rp 1.000,-)
320
560
750
250
430
1250
450
730
2450
1740
1760
450
250
3550
560
280
2450
4650
1760
250
260
280
1790
240
250
1260
1880
280
250
320
4570
2950
560
4500
430
280
560
1250
2450
290
480
3280
470
270
1880
1880
1760
1880
1880
1760
450
560
3250
3350
250
250
450
280
590
1880
430
2450
260
430
560
570
1790
430
560
1970
3350
250
450
250
430
2900
290
1250
3280
470
1260
260
1260
2760
1740
430
2450
560
260
1260
480
2450
580
470
250
3250
560
560
2650
1250
2450
250
1860
4560
4850
1280
430
1940
250
2450
270
1880
450
2450
430
270
2580
1760
2650
440


Rata-rata hitung                      
                                          
       = Rp 1.262.500

Untuk data berkelompok
Rata-rata hitung =                                    

x = nilai data masing-masing sampel
f = frekwensi masing-masing kelompok
f.x = perkalian frekuensi masing-masing kelompok dengan nilai x dari kelompok tersebut
N = jumlah data
Untuk mengelompokkan data, perlu dibuat tabel frekuensi, yaitu tabel yang menunjukkan berapa kali nilai Xi terjadi.

Contoh: Dari data berkelompok PT Karya Guna Abadi

Kelompok Gaji
Nilai Tengah (x)
Frekuensi (f)
f.x
< 500
501-1000
1001-1500
1501-2000
2001-2500
2501-3000
3001-3500
3501-4000
4001-4500
4501-5000
250
750
1.250
1.750
2.250
2.750
3.250
3.750
4.250
4.750
50
15
9
19
9
6
6
1
1
4
12500
11250
11250
33250
20250
16500
19500
3750
4250
19000



Kelompok Gaji
Nilai Tengah (x)
Frekuensi (f)
f.x
< 500
501-1000
1001-1500
1501-2000
2001-2500
2501-3000
3001-3500
3501-4000
4001-4500
4501-5000
250
750
1.250
1.750
2.250
2.750
3.250
3.750
4.250
4.750
50
15
9
19
9
6
6
1
1
4
12500
11250
11250
33250
20250
16500
19500
3750
4250
19000
Jumlah

120
= n
151.500
= åf.x

Rata-rata hitung

Ternyata, rata-rata hitung dari data yang sama, baik yang tidak dikelompokkan maupun dikelompokkan hasilnya sama yaitu Rp. 1.262.500.

Rata-rata hitung tidak selalu dapat dipakai dengan baik mewakili suatu kelompok nilai. Jadi, jika tiga SMU mempunyai nilai rata-rata yang sama untuk ujian matematika dari murid-muridnya, misalnya 7, itu tidak berarti mutu pengajaran matematika dari ketiga SMU tersebut sama pula.

No. Murid
Nilai Rata-Rata Ujian Matematika
SMU I
SMU II
SMU III
1
7
7
8
2
7
6
8
3
7
5
5
4
7
8
9
5
7
7
10
6
7
9
6
7
7
7
3
8
7
6
4
9
7
7
8
10
7
8
9
Jumlah
70
70
70
Rata-rata
7
7
7


Dari angka-angka pada tabel tersebut di atas, terlihat bahwa rata-rata 7 untuk SMU I, SMU II dan SMU III berasal dari nilai-nilai yang derajat homogenitasnya tidak sama. Nilai-nilai yang dimiliki SMU I betul-betul sempurna homogen (semuanya 7), sedangkan nilai-nilai yang dimiliki SMU II sudah kurang homogen lagi, dan untuk SMU III nilai-nilainya sudah menjadi semakin tidak homogen lagi atau heterogen. Dengan kata lain, secara kasar, nilai rata-rata SMU I dan SMU II masih dapat dianggap mewakili seluruh nilai yang ada dalam kelompoknya, akan tetapi nilai rata-rata yang dimiliki SMU III kelihatannya kurang atau tidak bisa mewakili nilai-nilai dalam kelompoknya karena sifatnya heterogen (sangat bervariasi).

Di sini terlihat bahwa, sepanjang berdasarkan data tersebut di atas dan tanpa mempertimbangkan faktor-faktor lainnya, mutu pengajaran matematika di SMU I adalah yang paling baik, diikuti oleh SMU II dan yang paling buruk adalah SMU III.

Nilai rata-rata hitung akan dengan baik mewakili nilai-nilai yang sifatnya relatif homogen dalam kelompoknya. Jika nilai-nilai dimaksud relatif sudah tidak homogen lagi atau heterogen, biasanya digunakan nilai median untuk mewakili kelompoknya.

CARA MENGHITUNG MEDIAN (NILAI TENGAH)

Median adalah suatu nilai yang membagi data yang diobservasi menjadi dua bagian yang sama, setelah data tersebut disusun dari urutan yang terbesar sampai yang terkecil atau sebaliknya. Setengah dari nilai-nilai yang ada besarnya sama atau lebih kecil dari nilai median, sedangkan setengah lainnya besarnya sama atau lebih besar dari nilai median.

Contoh:
Data asli (belum diurutkan):
4        8   6  10  2   3   5   7   9   5   3   12   5   15   9




6

Data setelah diurutkan mulai dari yang terkecil:
2        3   3   4   5   5   5         7   8   9   9   10   12   15

7 nilai                                                          7 nilai






6

    Data setelah diurutkan mulai dari yang terbesar:
  15   12   10   9   9   8   7         5   5   5   4   3   3   2

                           Median = Med = 6

Jika jumlah datanya ganjil, Med berada tepat di tengah-tengah. Seperti dalam contoh di atas, jumlah data ada 15, nilai Med ada pada data yang ke -8.
Bagaimana jika jumlah datanya genap?

Contoh (sudah diurut):


11

2   5   9   10   12   15   17   20  (jumlah data ada 8 = genap)

   4 nilai               4 nilai



          Med = antara 10 dan 12 atau = 11

Dengan demikian, rumus untuk mencari Med adalah :




Untuk jumlah data ganjil (n ganjil)

                               dan n = jumlah data

Untuk jumlah data genap (n genap)






                      dan n = jumlah data

Kelemahan Median adalah tidak bisa menggambarkan berapa jauhnya jarak nilai Median terhadap nilai data yang maksimum dan minimum. Oleh karenanya, dalam menggunakan Median sebaiknya disebutkan juga nilai data yang maksimum dan yang minimum.

CARA MENGHITUNG MODUS

Modus ialah suatu nilai yang mempunyai frekuensi terbesar, atau nilai yang paling sering terjadi.
Contoh: Nomor-nomor sepatu pria yang dipakai di tiga daerah yang diambil dari masing-masing 10 sampel.

No. Sampel
Daerah 1
Daerah 2
Daerah 3
1
40
38
38
2
39
42
38
3
39
39
40
4
41
40
41
5
42
42
40
6
40
42
41
7
42
39
41
8
40
42
40
9
41
40
38
10
41
42
42
Modus
40 dan 41
42
38,40 dan 41
Frekuensi
Masing-masing 3
5
Masing-masing 3
Rata-rata
40,5
40,6
40,1

Penjelasan:
o        Daerah 1 mempunyai Modus sebanyak 2 buah, yaitu nomor 40 dan 41.
o        Daerah 2 hanya mempunyai 1 Modus, yaitu nomor 42.
o        Daerah 3 mempunyai 3 Modus, yaitu nomor 38, 40 dan 41.
o        Jadi, nilai modus tidak selalu tunggal, tetapi bisa 2,3 atau lebih lagi, bahkan bisa terjadi ada data yang tidak mempunyai modus sama sekali.
o        Bayangkan jika data tersebut di atas adalah hasil survey sebuah perusahaan sepatu, yang memproduksi jumlah terbesar sepatunya berdasarkan nomor rata-ratanya. Jadi, walaupun data sifatnya homogen, tapi dalam kasus tersebut, tidak benar jika digunakan nilai rata-rata atau nilai mediannya.

SIMPANGAN BAKU (UKURAN PENYEBARAN DATA)

Dalam penjelasan tentang perhitungan rata-rata di atas, ternyata kelompok-kelompok data yang mempunyai nilai rata-rata yang sama, belum tentu menggambarkan derajat homogenitas yang sama pula. Lalu, bagaimana cara mengukur tingkat homogenitas atau penyebaran data atau variasi suatu kelompok data ? Caranya adalah dengan mengukur simpangan bakunya. Nilai simpangan baku adalah sama dengan akar dari nilai varians-nya dan nilai tersebut akan menggambarkan bagaimana derajat penyebarannya (berpencarnya) suatu kelompok data.

Untuk data sampel, simpangan baku disebut dengan S dan varians-nya disebut dengN S2 (pangkat dua dari simpangan baku, merupakan statistik). Untuk data populasi, simpangan baku disebut dengan σ (tho) dan varians-nya disebut dengan σ2.

Jadi, rumus untuk mencari nilai simpangan baku adalah:

Untuk data sampel:    

Simpangan baku biasa disebut deviasi standar. Pangkat dua dari simpangan baku dinamakan variasi.
Contoh menghitung simpangan baku:
No. Murid
Nilai Ujian Matematika
SMU I
SMU II
SMU III

x
ŝ-x
(ŝ-x)2
x
ŝ-x
(ŝ-x)2
x
ŝ-x
(ŝ-x)2
1
7
0
0
7
0
0
8
+1
+1
2
7
0
0
6
-1
+1
8
+1
+1
3
7
0
0
5
-2
+4
5
-2
+4
4
7
0
0
8
+1
+1
9
+2
+4
5
7
0
0
7
0
0
10
+3
+9
6
7
0
0
9
+2
+4
6
-1
+1
7
7
0
0
7
0
0
3
-4
+16
8
7
0
0
6
-1
+1
4
-3
+9
9
7
0
0
7
0
0
8
+1
+1
10
7
0
0
8
+1
+1
9
+2
+4
Jumlah
70
0
0
70
0
+12
70
0
+50
Rata-rata
7


7


7




Simpangan baku SMU I =
                            
Simpangan baku SMU II =
                                    
Simpangan baku SMU III =


Dari perhitungan simpangan baku di atas, ternyata:
·         Simpangan baku dari nilai ujian matematika di SMU I = 0, hal ini berarti kelompok datanya betul-betul mutlak homogen, sehingga rata-ratanya betul-betul sangat mewakili kelompoknya.
·         Simpangan baku dari nilai ujian matematika di SMU II = 3,464, hal ini berarti kelompok data sudah kurang homogen lagi. Walaupun demikian, karena simpangan bakunya masih relatif kecil, mungkin nilai rata-ratanya masih bisa digunakan untuk mewakili data dalam kelompoknya.
·         Simpangan baku dari nilai ujian matematika di SMU III = 7,071 yang menunjukkan bahwa kelompok data sudah makin tidak homogen atau heterogen. Oleh karenanya perlu dipertimbangkan, apakah nilai rata-ratanya masih akan dipakai untuk mewakili nilai-nilai data dalam kelompoknya atau tidak.
·         Jadi, semakin kecil nilai simpangan baku, semakin homogen nilai-nilai yang terdapat dalam kelompok data yang bersangkutan dan semakin baik nilai rata-ratanya dalam mewakili kelompoknya.

Hubungan  Mean, Median Dan Modus

Jika Mean mengukur rata-rata sekelompok data, Median mengukur titik tengah data, maka Modus mengukur ’pusat’ data dengan mendeteksi nilai data yang paling sering muncul. Secara logika, jika data mempunyai nilai-nilai yang sama, maka jelas Mean sama persis dengan Median, dan Median juga sama persis dengan Modus.

Sebagai contoh, berikut nilai sekelompok data yang sama:
5        5        5        5        5        5
Dari data di atas, maka:
à Mean jelas bernilai 5, karena semua nilai sama, yakni 5
à Median juga bernilai 5, karena diurutkan ke manapun, nilainya juga tetap 5
à Modus juga bernilai 5, karena nilai yang terbanyak muncul juga cuma satu yakni 5

Jadi untuk data yang ’ideal’ seperti di atas, atau untuk data yang berdistribusi normal (penjelasan distribusi normal lihat modul lainnya), berlaku ketentuan :

MEAN = MEDIAN = MODUS

Namun demikian, tidak semua data mempunyai nilai seperti itu, atau mesti berdistribusi normal. Banyak data dalam praktek yang cukup bervariasi, sehingga bisa agak menceng ke kiri atau menceng ke kanan (penjelasan kemencengan lihat modul lain di belakang).Untuk data dengan kemencengan yang moderat, hubungan antara Mean, Median dan Modus secara umum adalah :

MODUS = MEAN -3(MEAN-MEDIAN)

Dengan ketentuan:
JIKA DISTRIBUSI DATA CENDERUNG MENCENG KE KANAN (RIGHT SKEWED).












 Modus Median Mean
 Gambar Distribusi yang Right Skewed

Untuk data yang agak menceng ke kiri, maka nilai Mean lebih besar dari Modus.
JIKA DISTRIBUSI DATA CENDERUNG MENCENG KE KIRI (LEFT SKEWED)











                                      Mean Median Modus
Gambar Distribusi yang Left Skewed

Untuk data yang agak menceng ke kiri, maka nilai mean lebih kecil dari Modus. Namun demikian, baik pada distribusi yang menceng ke kanan atau menceng ke kiri, nilai Median tetap terletak di tengah pada kedua janis distribusi data tersebut. Maka pada distribusi data yang menceng secara moderat, seharusnya Median adalah alat ukur central tendency yang paling akurat (tepat) untuk menggambarkan karakteristik data. Walau demikian, dalam praktek penilaian secara subjektif serta pertimbangan kepopuleran alat lebih menentukan manakah alat ukur central tendency yang akan digunakan.

Kasus 1:
Sebagai contoh, data temperatur udara di sembilan kota di Pulau Jawa dalam sebulan terakhir:
Kota
Temperatur (oC)
Malang
21
Surabaya
24
Yogyakarta
26
Bandung
23
Semarang
27
Jakarta
28
Magelang
23
Solo
23
Cirebon
25

Keterangan:
Temperatur Kota Malang dalam sebulan terakhir rata-rata adalah 21oC. Demikian seterusnya untuk pengertian data lainnya.

Mean
Rata-rata temperatur di sembilan kota tersebut adalah :


Rata-rata temperatur adalah 24,440C.

Median
Karena data tidak berkelompok, maka dilakukan proses:
Mengurutkan data tersebut, misal dari terkecil-terbesar (ascending), sehingga menjadi :
Urutan 1
Urutan 2
Urutan 3
Urutan 4
Urutan 5
21
23
23
23
24
Urutan 6
Urutan 7
Urutan 8
Urutan 9

25
26
27
28


Mencari Median. Urutan Median adalah:


Dari tabel array (urutan) di atas terlihat urutan ke 5 adalah 24. Dengan demikian, Median dari Temperatur adalah 240C.

Modus

Untuk data tidak berkelompok, sama dengan perlakuan terhadap Median, data diurutkan terlebih dahulu, sehingga menjadi seperti yang terlihat pada tabel di atas (lihat urutan pada Median). Modus adalah data yang paling sering keluar, yang jika dilihat pada tabel di atas adalah angka 23, yang berjumlah 3 buah. Dengan demikian Modus Temperatur adalah 230C.

·         Bagaimana Hubungan Mean, Median Dan  Modus ?
Jika dimasukkan pada persamaan di atas :

Modus = 24,44 – 3 (24,44 – 24) = 23,11

Perhatikan nilai Modus dengan persamaan di atas, yang menghasilkan temperatur 23,110C. Bandingkan dengan penghitungan Modus sebelumnya, (230C) yang hanya berselisih sedikit dengan perhitungan menggunakan hubungan Mean, Median dan Modus.
Catatan:
Karena modus (23,11) lebih kecil dari Mean (24,44), maka distribusi data relatif menceng ke kanan.

Kasus 2:
Kasus sama dengan kasus pada modul MODUS.
Berikut data usia 15 orang karyawan sebuah perusahaan (dalam satu tahunan)
24
24
29
26
21
30
25
24
20
24
24
26
26
25
28

Langkah mencari Modus, Median dan Mean :
Dari data di atas, dibuat urutan dari usia secara ascending, dengan hasil :
No.
Nilai
No.
Nilai
No.
Nilai
1
20
6
24
11
26
2
21
7
24
12
26
3
24
8
25
13
28
4
24
9
25
14
29
5
24
10
26
15
30

Pada tabel di atas terlihat :

·         Modus atau data terbanyak adalah 24 tahun, yakni sejumlah 5 buah.
·         Median atau titik tengah data. Karena jumlah data ganjil, maka median ada pada tengah data, atau urutan ke 8 yakni 25 tahun.
·         Mean atau rata-rata hitung, yang bisa dicari dengan rumus :

Yang berarti Mean adalah 25,06 tahun
Dengan demikian jika akan menghitung Modus dengan menggunakan Median dan Mean adalah :
          Mo = 25,06 – 3(25,06-25) = 24,8 tahun
Perhatikan perbedaan yang tidak besar antara hasil Modus (24 tahun) dengan Modus dari perhitungan (24,8 tahun).

Jika diperhatikan ketiga nilai central tendency tersebut, terlihat bahwa:

Mean ≠ Median ≠ Modus, karena 25,06 ≠ 25 ≠ 24 tahun

Hal ini berarti distribusi data di atas tidak bisa dikatakan simetris atau normal. Namun demikian perbedaan tersebut tidaklah besar, sehingga bisa juga dikatakan distribusi data tersebut menceng secara moderat. Tingkat kemencengan bisa diukur dari Koefisien Pearson:

      Sk = (25,06 – 24)/2,65 = +0,4

Hasil +0,4 berrati distribusi menceng ke kanan (karena tanda positif) dan secara moderat, karena angka 0,4 masih di bawah 1.

Tidak ada komentar:

Poskan Komentar