PENGERTIAN DATA DAN STATISTIK


Data dan statistik mempunyai hubungan yang sangat erat. Selain itu, keduanya juga mempunyai hubungan yang sangat erat dengan kehidupan manusia sehari-hari, dengan bidang ilmu pengetahuan, baik yang eksakta, sosial, ekonomi, bisnis dan lain-lain. Data dan statistik serta fungsi keduanya, banyak memberikan kegunaan yang sangat tidak ternilai bagi manusia, bagi kita semua.

DATA, KEGUNAAN DAN FUNGSINYA

Anda sebagai individu, seorang manajer, atau mungkin seorang pengusaha, menginginkan untuk:
 Mengetahui siapa saja yang akan pensiun tahun depan, dari bagian mana, apa jabatannya, berapa pesangon yang akan didapat, dan sebagainya. Tujuannya adalah antara lain:
• Mempersiapkan dana, berapa besarnya untuk pembayaran pesangon mereka.
• Mempersiapkan penerimaan karyawan baru untuk mengganti karyawan yang bakal pensiun tersebut (walaupun tidak semua).
Untuk maksud tersebut, Anda memerlukan data berupa data pegawai, yang mungkin cukup didapat dari dalam perusahaan sendiri.
 Mengetahui tingkat kepuasan konsumen produk yang anda pasarkan, bagaimana respon mereka terhadap mutu produk Anda, harga, pelayanan dan sebagainya. Untuk inipun, Anda perlu data, malah mungkin data tersebut perlu dikumpulkan di lapangan melalui survei (terlepas dari apakah dilakukan sendiri atau dengan membayar lembaga riset yang Anda percayai).
 Mengetahui apakah proses produksi saat ini masih terkendali atau tidak. Berapa persen dari produksi yang tertolak karena dianggap cacat, lengkap dengan perinciannya per mesin, per lokasi, kapan, mengapa dan lain-lain. Untuk inipun, Anda memerlukan data (yang didapat dari bagian produksi).
 Mengetahui perkembangan perekonomian (trend) untuk jangka waktu tertentu, pertumbuhan penduduk penduduk, pendapatan nasional dan sebagainya . Termasuk juga mengetahui faktor-faktor atau variabel yang mempengaruhi pertumbuhan ekonomi.

Dari contoh-contoh tersebut diatas, kita mengetahui betapa pentingnya data. Dengan data, kita mengetahui gambaran perusahaan sekarang, masalah apa yang sedang dihadapi, mengapa terjadi masalah-masalah tersebut, bagaimana cara pemecahannya. Dengan data, kita dapat meramal atau memperkirakan, apa yang kira-kira bakal terjadi di masa mendatang. Dengan data, kita pun bisa membuat perencanaan, peramalan, mengontrol pelaksanaan, mengevaluasi target apakah tercapai atau tidak, dan sebagainya. Dengan adanya data, kita dapat banyak mengetahui tentang berbagai hal. Dengan data, kita bisa mengambil keputusan-keputusan, kebijakan-kebijakan perusahaan, dan sebagainya. Pendeknya, fungsi dan manfaat data sangat penting dan banyak sekali. Sering kali, akan berbahaya jika kita mengambil kesimpulan dan keputusan tanpa didukung oleh data. Orang bilang ”Speak with data”, berbicaralah dengan data agar objektif dan lebih akurat. Sebenarnya apa itu data?

PENGERTIAN DATA DAN PENGGOLONGANNYA

Dari uraian di atas, sebenarnya data adalah kumpulan keterangan atau informasi yang diperoleh dari suatu pengamatan, dapat berupa angka, lambang atau sifat. Jika kita mendapatkan data yang tidak baik, sebaik apa pun cara pengolahan data yang kita lakukan, hasilnya atau kesimpulan yang didapat dari data tersebut tetap tidak baik. Semisal, ungkapan ”garbage in, garbage out”, yang artinya jika yang masuk sampah, yang keluar pun juga sampah. Jadi, syarat utama agar analisa data secara statistik menghasilkan informasi atau kesimpulan yang baik adalah data yang diolah haruslah juga baik.

Apa itu data yang baik? Data yang baik adalah data yang sifatnya representatif (mewakili), objektif (sesuai dengan apa yang ada atau yang terjadi), relevan (ada hubungannya dengan persoalan yang sedang dihadapi dan akan dipecahkan), mempunyai tingkat ketelitian yang tinggi atau standard error (kesalahan baku) yang kecil.

Dari mana data diperoleh? Data dapat diperoleh dari sumber internal (internal data) dan sumber eksternal (external data). Data internal adalah data yang didapat oleh organisasi itu sendiri untuk keperluan operasi sehari-hari. Organisasi dimaksud dapat berupa instansi pemerintah maupun swasta, misalnya departemen-departemen, Biro Pusat Statistik, BAPPENAS, BUMN, perusahaan-perusahaan swasta dan sebagainya. Sedangkan, data eksternal adalah data yang didapat dari luar organisasi yang bersangkutan, biasanya menggambarkan keadaan di luar organisasi tersebut. Contoh data jenis ini misalnya data pendapatan nasional, penduduk, harga-harga bahan pokok yang dukumpulkan oleh Biro Pusat Statistik, data keuangan negara yang dikumpulkan oleh departemen keuangan, data perbankan dari Bank Indonesia dan sebagainya, termasuk data yang dikumpulkan oleh badan-badan internasional, seperti UNESCO, IMF, FAO dan lain-lain.

1. DATA KUANTITATIF DAN DATA KUALITATIF

 DATA KUANTITATIF
Banyak data yang berbentuk angka atau bilangan, misalnya luas tanah, jumlah penduduk dan sebagainya. Untuk jenis data ini dapat dilakukan perhitungan-perhitungan atau operasi matematika, seperti penambahan, pengurangan, perkalian, pembagian dan sebagainya. Data kuantitatif nilainya bisa berubah-ubah sehingga disebut variabel.
Data kuantitatif dapat dibagi atas:
• Data Interval
Ukuran data mempunyai interval atau jarak, misalnya berat badan antara 50-60 kg.
• Data Rasio
Data berupa angka dalam arti yang sebenarnya, sehingga mempunyai nilai nol.
Data jenis ini diperoleh melalui pengukuran dan memiliki tingkat pengukuran paling tinggi diantara jenis data lainnya.

 DATA KUALITATIF
Data kualitatif adalah data yang bukan berbentuk angka atau bilangan, misalnya kepuasan pelanggan (sangat puas, puas, kurang puas dan sebagainya), sehingga kita tidak dapat melakukan operasi matematika terhadapnya. Jenis data ini disebut atribut.
Data kualitatif dapat dibagi atas:
• Data nominal
Ukuran data nominal adalah kategori, misalnya jenis kelamin, laki-laki atau wanita, tempat tinggal dan sebagainya. Dilihat dari tingkat pengukuran data, data nominal mempunyai tingkatan yang paling rendah dari jenis data lainnya. Hal tersebut karena walaupun dalam prakteknya data ini bisa diangkakan, tetapi terhadapnya tidak bisa dilakukan operasi matematika. Contoh pemberian angka tersebut di atas misalnya, angka ’1’ untuk yang tinggal di Jakarta, ’2’ untuk yang tinggal di Bandung, ’3’ untuk Surabaya dan sebagainya.
• Data Ordinal
Data ordinal hampir sama dengan data nominal, hanya saja data orrdinal mempunyai tingkatan data atau urutan kelas, ada yang lebih tinggi ada yang lebih rendah. Contoh data ini adalah data tentang kepuasan pelanggan, yang dibagi menjadi sangat puas, tidak puas, antara puas dan tidak puas, tidak puas dan sangat tidak puas. Data ordinal mempunyai tingkatan yang lebih tinggi dari data nominal. Walaupun mempunyai tingkatan, terhadap jenis data ini kita tetap tidak dapat melakukan operasi matematika.

Dilihat dari tingkat data, urutan dari yang paling tinggi adalah data rasio, data interval, data ordinal dan paling rendah data nominal.Untuk mengolah data kualitatif (data nominal dan ordinal), biasanya digunakan statistik non parametrik, sedangkan untuk data kuantitatif digunakan statistik parametrik.

2. DATA INTERNAL DAN DATA EKSTERNAL

• DATA INTERNAL
Data yang berasal dari dalam organisasi atau perusahaan sendiri. Data jenis ini biasanya berkaitan langsung dengan organisasi sendiri, misalnya data keuangan (neraca, laporan laba-rugi dan sebagainya), data kepegawaian, data produksi dan lain-lain.
• DATA EKSTERNAL
Data yang berasal bukan dari dalam organisasi perusahaan sendiri. Data ini sering tidak berkaitan langsung dengan organisasi sendiri, misalnya data tentang jumlah kendaraan di Jakarta, jumlah penduduk di suatu desa dan lain-lain.

3. DATA PRIMER DAN DATA SEKUNDER

• DATA PRIMER
Data yang dukumpulkan, diolah serta diterbitkan sendiri oleh organisasi yang menggunakannya. Contoh jenis data ini adalah data kependudukan yang dibuat oleh Biro Pusat Statistik, data tentang pertanian yang dibuat oleh Departemen Pertanian dan sebagainya.
• DATA SEKUNDER
Data yang tidak dibuat atau diterbitkan oleh penggunanya, misalnya data tentang jumlah kendaraan dari Departemen Perhubungan merupakan data primer bagi Departemen tersebut karena dibuat dan diterbitkannya, tapi merupakan data sekunder bagi PT X sebagai pengguna, yang mendapatkannya dari sumber lain (misalnya media massa) yang mengutipnya. Jadi, orang bisa mendapatkan data sekunder dari harian, majalah, buletin dan media massa lainnya yang mengutip data dari sumber-sumber lain yang menerbitkannya (misalnya data dikutip dari departemen, Biro Pusat Statistik, Bank Indonesia dan lain-lain). Dengan demikian, data eksternal bisa berupa data primer, bisa juga berupa data sekunder.

4. DATA DISKRIT DAN DATA KONTINYU

Seperti telah dikatakan di muka, data kuantitatif disebut variabel, karena nilainya atau besarnya bisa berubah-ubah, data ini dapat mempunyai variabel diskrit sehingga disebut data diskrit, dapat juga mempunyai variabel kontinyu atau indiskrit dan disebut dengan data kontinyu.

Data diskrit adalah data yang sifatnya terputus-putus, nilainya bukan merupakan pecahan (angka utuh). Sedangkan data kontinyu adalah data yang sifatnya sinambung atau kontinyu, nilainya bisa berupa pecahan. Contoh data diskrit adalah data tentang jumlah penduduk, kendaraan dan sebagainya, sedangkan contoh data kontinyu adalah data tentang hasil panen padi, panjang jalan, berat sapi dan sebagainya.

Gambar I. Jenis Data



sumber: Kuncoro, 2001:24

Statistik atau statistika adalah ilmu yang berhubungan dengan cara pengumpulan, pengolahan atau analisis, penyajian data dan cara pengambilan kesimpulannya. Fungsi utamanya adalah membantu dalam pengambilan keputusan dan keputusan tentang parameter populasi dengan menggunakan data sampel yang diambil dari populasi tersebut.

PENGGOLONGAN STATISTIK

Statistik dapat digolongkan dengan berbagai cara.

STATISTIK DESKRIPTIF DAN INDUKTIF (INFERENSI)
• STATISTIK DESKRIPTIF
Statistik Deskriptif berusaha menjelaskan atau menggambarkan berbagai karakteristik data, seperti berapa rata-ratanya, seberapa jauh data bervariasi dan sebagainya, tanpa membuat interpretasi apa-apa terhadap data tersebut.
• STATISTIK INDUKTIF (INFERENSI)
Statistik Induktif berusaha membuat berbagai inferensi terhadap sekumpulan data yang berasal dari suatu sampel. Tindakan inferensi tersebut misalnya melakukan perkiraan, peramalan, pengambilan keputusan dan sebagainya.

STATISTIK PARAMETRIK DAN NON PARAMETRIK

• STATISTIK PARAMETRIK
Statistik Parametrik adalah statistik induktif untuk populasi yang parameternya telah memenuhi persyaratan-persyaratan tertentu (misalnya, sebaran data mengikuti distribusi normal)
• SATISTIK NON PARAMETRIK
Statistik non parametrik adalah statistik induktif yang berusaha mengambil kesimpulan tentang keseluruhan populasi yang parameternya tidak memenuhi persyaratan, yaitu tidak mengikuti suatu distribusi tertentu. Jadi, statistik non parametrik digunakan untuk populasi yang tidak menetapkan persyaratan-persyaratan parameter populasinya.



PENGERTIAN DALAM STATISTIK PENTING YANG PERLU DIPAHAMI: POPULASI, ELEMEN, SAMPLING DAN SAMPEL

Populasi adalah kumpulan semua elemen yang ada yang akan diobservasi atau diteliti, sedangkan sampling adalah pengambilan sebagian kecil dari seluruh elemen populasi tersebut yang dijadikan sebagai contoh atau sampel yang dianggap dapat mewakili seluruh elemen dalam populasi. Sedangkan sampling adalah cara pengumpulan data dengan mengambil sampel atau contoh dari seluruh anggota populasi.

Misalkan, ada 100 orang murid kelas 3 di SMU Garuda. Pimpinan Sekolah ingin melihat prestasi ujian matematika mereka pada tahun 2001 yang lalu dan untuk itu diadakan pencatatan nilai ujian dari setiap murid yang berjumlah 100 murid tersebut satu per satu tanpa kecuali. Setiap murid tersebut disebut elemen. Kumpulan dari 100 orang murid tersebut (seluruh elemen) disebut populasi dan pekerjaan untuk meneliti seluruh elemen yang terdapat dalam populasi disebut sensus. Jika untuk maksud tersebut, hanya diambil 20 murid saja sebagai contoh, hal tersebut disebut sampling, dan contoh yang diambil dinamakan sampel.

Jika data yang didapat dari sensus dinamakan data sebenarnya (true value), data yang terdapat dari sampling merupakan data dugaan sehingga nilainya dinamakan nilai perkiraan (estimate value). Nilai perkiraan tentunya tidak akan sama betul dengan nilai sebenarnya, tentu ada selisih. Selisih ini disebut kesalahan perkiraan (error estimate) atau kesalahan sampling (sampling error) dan jika nilainya kecil, cara pengumpulan data dengan sampling masih dapat dipertanggung-jawabkan.

Agar data yang diperoleh dari sampling mempunyai nilai kepercayaan yang tinggi (valid) atau nilai kesalahan perkiraannya sekecil mungkin, dalam pengambilan sampel kita harus mengikuti metode pengambilan sampel yang baik (termasuk jumlah sampel yang harus diambil), sesuai dengan keadaan populasinya. Ada berbagai macam teknik sampling namun tidak akan dibahas di sini.(Silakan lihat Modul Metode Penelitian)

Alasan-alasan mengapa kita menggunakan sampling:
• Menghemat waktu, tenaga dan biaya.
• Secara teknis, tidak mungkin mengamati seluruh anggota populasi. Misalnya, meneliti seluruh jumlah ikan yang terdapat di suatu sungai, meneliti seluruh jumlah kelelawar di suatu hutan, jumlah seluruh kendaraan di suatu negara dan sebagainya.
• Pengamatan terhadap seluruh anggota populasi dapat bersifat merusak. Misalnya, pengaruh pemakaian narkoba terhadap kerusakan otak.
• Contoh lain-lain yang bergantung pada pertimbangan peneliti atau pengguna data.

Secara teoritis atau logika, hasil analisa atau pengolahan data yang dihasilkan oleh sensus (harusnya) memberikan data yang sebenarnya (true value). Sebaliknya, karena sampling hanya mengambil sebagian elemen saja yang ada dalam populasi, hasil analisa datanya hanya merupakan perkiraan (estimate value). Mengingat alasan-alasan dan pertimbangan-pertimbangan tersebut, khususnya oleh karena sensus biasanya memerlukan biaya, tenaga dan waktu yang lebih banyak dibandingkan dengan sampling, maka pada umumnya penelitian dilakukan hanya dengan cara sampling saja, dengan catatan pelaksanaan sampling tersebut dilakukan dengan baik. Baik dalam hal ini artinya, baik metode sampling maupun pelaksanaan pengumpulan datanya dilakukan dengan benar dan cermat, sehingga perkiraan yang diperoleh tidak banyak berbeda dari keadaan populasi yang sebenarnya.
Sampling yang baik pun tidak akan sempurna betul, selalu ada ketidaksempurnaan atau kesalahan (sampling error). Untuk dapat mewakili seluruh elemen dalam populasi harus diusahakan agar sampling dilaksanakan dengan sebaik-baiknya sehingga kesalahan yang terjadi dapat sekecil mungkin. Jadi, seperti halnya dalam sensus, dalam melakukan sampling pun, kesalahan selalu dapat terjadi. Jika nilai sampling ternyata sama betul dengan nilai yang sebenarnya seperti yang dilakukan pada sensus, hal tersebut hanya bersifat kebetulan.

Berapa besarnya sampel agar didapat data yang baik sehingga dapat mewakili suatu populasi? Untuk mengetahui berapa jumlah sampel, biasanya digunakan rumus-rumus sebagai berikut :




E = Kesalahan atau error yang diizinkan menyangkut ketelitian pendugaan.
Z = Nilai Z yang sesuai dengan interval keyakinan yang digunakan, yaitu 1,96 untuk I.K = 95% dan 2,58 untuk I.K = 99%.
S = Deviasi standar dari pra-survey yang dilakukan dengan sampel yang kecil untuk menduga deviasi standar populasi.

Untuk proporsi




P = Estimasi atau perkiraan proporsi populasi
Z = Nilai Z yang sesuai dengan interval keyakinan yang ditentukan
E = Kesalahan (error) maksimum yang diizinkan

Kesalahan (error) yang diizinkan misalnya sebesar 5%, berarti ketelitian yang diinginkan dalam pendugaan parameter populasi (interval keyakinan) adalah sebesar 95% (100%-5%), dan jika error yang diizinkan sebesar 1%, berarti tingkat ketelitian (interval keyakinan) yang ingin dicapai sebesar 99% (100%-1%). Dengan demikian, besarnya sampel bergantung pada interval keyakinan yang digunakan (error maksimum yang diizinkan) dan deviasi standar atau estimasi proporsi populasi (ukuran sampel untuk proporsi). Jika deviasi standar atau proporsi populasi belum diketahui, kita perlu mengadakan survey pendahuluan dengan ukuran sampel yang kecil untuk menduga deviasi standar populasi. Deviasi standar populasi dapat juga dilakukan berdasarkan pengetahuan tentang populasi.

Perhitungan deviasi standar distribusi sampling harus dikoreksi dengan faktor koreksi sebesar



Jika ukuran sampel (n) dibagi ukuran populasi (N) relatif cukup besar, akan tetapi jika ukuran populasi besar sekali apalagi tak terhingga atau ukuran populasi terbatas tapi relatif kecil, faktor koreksi tidak diperlukan.

Dari rumus tersebut di atas, semakin tinggi interval keyakinan maka semakin besar ukuran sampel yang dibutuhkan. Untuk lebih jelasnya, jika kita ingin yakin 100% interval duga akan sama dengan parameter populasi jumlah sampel yang harus diambil adalah seluruh populasi, ini berarti sama dengan sensus.

PARAMETER DAN SAMPLING ERROR

Seperti telah diterangkan dimuka, baik dalam melaksanakan sensus maupun cara pengambilan sampel (sampling), kesalahan dapat saja terjadi (error sampling) baik disengaja maupun yang tidak disengaja. Jenis kesalahan yang mungkin terjadi dimaksud adalah:
• Kesalahan secara umum (baik sensus maupun sampling):
• Kesalahan mencatat (recording’s error),
• Kesalahan mengukur (measurement’s error),
• Kesalahan menjawab (response’s error),
• Kesalahan mengingat (recal’s error),
• Kesalahan mengamati (observation’s error) dan sebagainya.
• Kesalahan lainnya khusus dalam sampling :
• Kesalahan penentuan responden (misspecification of sample subject).
• Kesalahan variasi acak (random variation error).
• Kesalahan penarikan sampel (sampling error).
• Kesalahan spesifikasi (specification error).
• Kesalahan karena tidak lengkapnya respon (non response error).
• Kesalahan karena tidak lengkapnya cakupan elemen populasi (coverage error) dan sebagainya.

11 komentar:

  1. Terimakasih atas informasinya, sangat membantu.
    Salam.
    Statistik

    BalasHapus
  2. terimakasih banget..maju trus...

    BalasHapus
  3. postingan ini sangat menarik serta enak dibaca.... saya berharap bisa berkunjung lagi

    BalasHapus
  4. postingan ini sangat menarik serta enak dibaca.... saya berharap bisa berkunjung lagi

    BalasHapus
  5. rumusnya bagaimana cara menampilkan?
    apa perlu font atau setting browser?

    BalasHapus
  6. Postingan ini sngt menarik,,,, sngt bermanfaat bwngt .

    BalasHapus
  7. nah ini info yg aq btuhkan.. thankz

    BalasHapus