Posts Tagged ‘data’

Sampel dan Ukuran Sampel

April 14, 2009

Keabsahan hasil penelitian atau survey sangat bergantung pada data sampel. Data sampel yang baik akan menghasilkan kesimpulan yang baik. Sebaliknya, data sampel yang buruk akan menghasilkan kesimpulan yang buruk pula. Bahkan, data sampel yang buruk dapat menghasilkan kesimpulan yang menyesatkan. Mengapa demikian? Ini ada kaitannya dengan sifat alamiah dari uji statistika itu sendiri.

Uji statistika itu hanyalah suatu alat. Uji ini tidak memiliki kemampuan untuk bisa menyaring baik-buruknya data yang masuk. Uji statistika bagaikan mesin atau robot tanpa indera. Buruk masuk, maka buruk keluar. Baik masuk, maka baik keluar. Dengan demikian, kesyahihan kesimpulan dari suatu uji statistik bermula dari kesyahihan data sampel.

Data sampel yang baik adalah data yang objektif dan representatif. Data sampel yang objektif dan representatif dapat diperoleh dengan melakukan dua hal yaitu 1) pengacakan (randominasi) data dan 2) pengambilan jumlah sampel yang memadai.

Pengacakan data bertujuan untuk mendapatkan data yang objektif. Data yang diperoleh dari proses pengacakan adalah data yang acak. Data acak bermakna data tanpa pilih kasih atau intervensi dari peneliti. Untuk mendapatkannya, si peneliti harus menciptakan kondisi sedemikian rupa sehingga setiap angka yang ada pada populasi harus mempunyai kesempatan yang sama untuk ditarik sebagai sampel pada saat pengambilan sampel. Artinya, data yang diperoleh bukan atas kemauan si peneliti. Dengan demikian, data acak akan menghasilkan data yang objektif.

Data yang representatif sangat ditentukan oleh ukuran sampel. Semakin besar ukuran atau jumlah sampel sampai pada tingkat tertentu, maka semakin representatif sampel tersebut. Begitu pula, semakin representatif suatu sampel akan semakin akurat suatu kesimpulan yang dihasilkan. Namun demikian, jumlah sampel juga terkait dengan waktu, tenaga, dan dana yang diperlukan. Semakin banyak sampel, maka semakin banyak pula waktu, tenaga, dan dana yang diperlukan. Bisa dibayangkan betapa sulit dan mahalnya, kalau kita harus mendata seratus juta orang. Oleh karena itu, perlu suatu angka kompromi, suatu angka yang efisien tapi dapat diterima secara statistika.

Ada beberapa cara yang bisa ditempuh untuk menentukan jumlah sampel. Namun demikian, di sini hanya diberikan satu cara saja, yaitu dengan menggunakan rumus. Ada banyak rumus yang ditawarkan oleh para ahli statistika menurut bidang dan jenis uji yang akan dipakai untuk menganalisis data sampel tersebut. Berikut adalah formula tersebut:

1. Formula menghitung jumlah sampel untuk peubah kontinu menurut Sokal dan Rohlf (1981)

n ≥ 2 (σ/δ)2tα(v) + t(2β)v)2

n = jumlah sampel

σ = standar deviasi populasi

δ = perbedaan terkecil yang ingin dideteksi

α = taraf significan (misalnya 0,05)

v = t(n-1)

t = jumlah perlakuan

β= taraf kesalahan tipe II

Perlu diketahui bahwa rumus ini dipakai dengan solusi berulang (iterative). Artinya perhitungan dilakukan berulang-ulang sampai mencapai n yang stabil.

Pertama kita coba n = 20 sebagai percobaan. Ini menghasilkan v = 4(20-1) = 76, bila jumlah perlakuannya 4 (misalnya, 4 lokasi atau 4 cara dsbnya). Standar deviasi (S) = 6 % (6y/100) dan δ= 5% dari rata (5y/100). Memakai S sebagai estimasi untuk σ, maka ratio σ/δ=6/5. α=0,01 dan β=0,20.

Maka,

n ≥ 2(σ/δ)2tα(v) + t(2β)v)2

n = 2 (6/5)2(t0,01(76) + t2(0,20)(76))2

= 2 (1,2)2 (2,642 + 0,847)2

= 2(1,44)(12,171) = 35,1

Maka, berikutnya

Kita gunakan n = 35, yang menghasilkan v=4(35-1)= 4(34) = 136

Maka,

n ≥ 2(1,44)(2,612 + 0,845)2 = 2,88 (11,95) = 34,45

Kita bulatkan menjadi 35. Nilai ini sama dengan solusi yang pertama yang mengindikasikan bahwa nilai ini sudah stabil. Dengan demikian, untuk penelitian ini diperlukan 35 sampel untuk setiap perlakuan. Total sampel untuk 4 perlakuan menjadi 4(35) = 140 sampel

2. Formula lain untuk menghitung sampel untuk peubah kontinu

Ada dua metoda untuk menentukan ukuran sampel untuk peubah yang kontinu. Metode pertama adalah menggabungkan semua respons kedalam dua katagori dan kemudian gunakan formula proporsional untuk menghitungnya. Cara kedua adalah menggunakan formula berikut ini.

n = z2σ2/e2

dimana

n = jumlah sampel

z = nilai pada kurva normal (1-α), misalnya 95%

e = keakuratan

σ = varian populasi

Sebagai contoh,

Katakan kita ingin mengevaluasi program penyuluhan yang mengajak petani untuk menggunakan beberapa varietas unggul baru. Anggaplah populasinya besar. Kita tidak mau berasumsi mengenai tingkat penerimaan dari setiap varietas tersebut, namun kita bersedia menerima Standar deviasi 30% (0,3). Selanjutnya kita pilih α = 0,05 dan keakuratan 5% . Maka, jumlah sampel yang diperlukan adalah sebagai berikut:

n = z2σ2/e2= (1,96)2(0,32/(0,05)2=138,3 petani

Kelemahan formula ini adalah perlunya nilai estimasi yang baik untuk nilai σ. Bahkan sering nilai estimasi juga tidak tersedia. Oleh karena itu, formula menghitung sampel untuk peubah proporsional lebih disukai.

3. Formula menghitung jumlah sampel untuk peubah proporsional

Untuk populasi yang besar, Cochran (1963:75) mengembangkan formula sebagai berikut:

n = z2pq/e2

dimana

n = jumlah sampel

z = nilai pada kurva normal (1-α), misalnya 95%

p = proporsi estimasi dari kejadian pada populasi

q = 1-p

e = keakuratan

Sebagai contoh, katakan kita ingin mengevaluasi program penyuluhan yang mengajak petani untuk menggunakan metode baru. Anggaplah populasinya besar tetapi kita tidak tahu persentase dari penerimaan metode baru tersebut. Oleh karena itu, kita berasumsi tingkat penerimaannya 50:50 atau p = 0,5. Selanjutnya kita pilih α = 0,05 dan keakuratan 5% . Jumlah sampel yang diperlukan adalah sebagai berikut:

n = z2pq/e2 = (1,96)2(0,5)(0,5)/(0,05)2= 385 petani

4. Koreksi untuk populasi terbatas dari peubah proporsional

Jika populasi yang dipelajari kecil, maka jumlah sampel bisa lebih kecil lagi. Ukuran sampel bisa dihitung menggunakan formula berikut.

n1 = n/(1+((n-1/N))

Dimana

n1 = jumlah sampel koreksi

N = jumlah populasi

Contoh, misalnya jumlah petani yang mungkin terpengaruhi oleh penerapan metode baru tersebut adalah 2000 orang,

Maka jumlah sampel koreksi adalah

n1 = n/(1+((n-1/N)) = 385/(1+((385-1)/2000))= 323 petani

 

 

5. Formula sederhana untuk peubah proporsional

Yamane (1967) memberikan formula yang sederhana untuk menghitung jumlah sampel. Furmulanya adalah sebagai berikut

n = N/(1+N(e2)=2000/(1+2000(0,052) = 333 petani

 

dimana

n = jumlah sampel

N = jumlah populasi

e = keakuratan

6. Formula sederhana untuk rancangan percobaan

Dalam buku perancangan percobaan, Mbue Kata Bangun (1980) memberikan formula jumlah sampel (t-1)(n-1) ≥ 15 atau bisa ditulis juga sebagai berikut

n ≥ 1 + (15/(t-1))

 

dimana

n = jumlah sampel

t = jumlah perlakuan

 

Contoh: kita ingin menguji 4 jenis varietas padi baru, maka ulangan yang diperlukan adalah

n ≥ 1+(15/(4-1)) = 6

sehingga unit percobaan adalah txn = 4×6=24

7. Formula sederhana lainnya berdasarkan formula

n = z2σ2/e2

bila α=5% (sering menjadi patokan), maka z2= 1,962=3,84, coeficien variation (cv)= 20% (nilai yang umum pada percobaan di lapangan), maka jumlah ulangan ditentukan berdasarkan nilai e (penyimpangan dari nilai rata-rata). Dengan demikian, formulanya dapat disederhanakan menjadi

n ≥ 0,40 (1/e)

Bila e kita tetapkan 1%, maka jumlah sampel yang diperlukan adalah

n ≥ 0,40 (1/0,01) = 40

 

 

 

Data dan Variabel

Februari 27, 2009

Data statistika mempunyai harga yang berubah-ubah atau bervariasi sehingga disebut juga dengan peubah atau variable.  Peubah atau variable ini dapat dibagi dalam dua kategori, yaitu variable kuantitatif dan variable kualitatif.

Variabel  kuantitatif adalah variabel yang berbentuk bilangan.  Variabel kuantitatif ini dapat berupa variable kontinyu ataupun variable diskontinyu.  Variabel kontinyu adalah data yang secara teori mempunyai nilai yang tidak terbatas diantara dua titik angka.  Misalnya, antara dua pengukuran tinggi tanaman padi 20 cm dengan 21 cm akan ada sejumlah nilai angka yang tidak terbatas banyaknya yang dapat diukur jika kita mau mengukurnya dan tergantung juga pada kemampuan alat ukur yang digunakan.  Misalnya saja antara dua titik 20 dan 21 bisa ada angka 20,5 cm, 20,6 dstnya.  Variabel kontinyu ini umumnya diperoleh dari hasil pengukuran.  Contoh jenis varibel ini adalah panjang, tinggi, berat, dan suhu.

Sebaliknya variable diskontinyu adalah variable yang hanya mempunyai nilai yang bulat sehingga tidak mempunyai nilai antara atau nilai pecahan diantara dua titik nilai.  Nilai variable ini dapat berupa angka 4 atau 5 atau 6, tetapi tidak pernah berupa 4,3 atau 5,7.  Contoh dari variable ini adalah jumlah bibit tanaman, jumlah binatang, jumlah orang, jumlah mikroorganisme, jumlah gigi.  Variable diskontinyu ini disebut juga variable meristik atau variable discret.  Variable ini biasanya diperoleh dari hasil menghitung atau membilang.

Variable lainnya adalah variable kualitatif.  Variable ini adalah variable yang tidak dapat diukur tetapi dapat dinyatakan dalam bentuk kualitas.  Misalnya jenis kelamin orang tidak dapat diukur tetapi bisa dinyatakan sebagai laki-laki atau perempuan.  Warna kulit orang dapat dinyatakan dalam bentuk putih atau hitam.  Akan tetapi dalam hal tertentu, warna juga dapat dinyatakan dalam bentuk kuantitatif karena juga dapat diukur.  Misalnya warna cahaya dapat dinyatakan dalam bentuk panjang gelombang yang berbentuk variable kuantitatif.

PENGERTIAN STATISTIKA

Februari 27, 2009

Statistik dan Statistika

Statistik memiliki dua pengertian.  Pertama, statistik dipakai untuk menyatakan kumpulan data, bilangan, dan bukan bilangan, yang disusun dalam tabel atau diagram yang melukiskan atau menggambarkan suatu persoalan.  Misalnya statistik penduduk, statistik kehutanan, dll.  Kedua, statistik dipakai untuk menyatakan ukuran dari kumpulan data sample.  Misalnya, jika kita meneliti 20 pegawai dan mencatat gajinya setiap bulan lalu menghitung rata-rata gajinya, misalnya diperoleh Rp 100.000,-.  Maka rata-rata besarnya gaji Rp 100.000,- ini dinamakan statistik.  Sebagai lawan dari statistik adalah parameter, yaitu ukuran dari seluruh data atau populasi.

Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan data, pengolahan, dan penarikan kesimpulan berdasarkan kumpulan data.  Oleh karena itu, pengetahuan yang mempelajari hal-hal yang berkaitan dengan penanganan data adalah statistika bukan statistik.  Statistika lebih lanjut terbagi dalam dua kategori, yaitu statistika deskriptif dan statistika inferensia.

Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian sekumpulan data sehingga memberikan informasi yang berguna.  Perlu kiranya dimengerti bahwa statistika deskriptif hanya memberikan informasi mengenai data tersebut dan sama sekali tidak menarik kesimpulan apapun tentang data induk dari data tersebut.  Penyusunan tabel, diagram, grafik, rata-rata, dan standar deviasi di majalah dan surat kabar termasuk dalam kategori statistika deskriptif ini.

Statistika inferensia mencakup semua metode yang berhubungan dengan pengolahan data untuk kemudian sampai pada penarikan kesimpulan dan peramalan mengenai sekumpulan data.  Statistika jenis ini dapat berupa estimasi, uji hipotesis, prediksi, dan tingkat huibungan antara variable.  Fungsi utamanya adalah membantu peneliti atau pemimpin perusahaan untuk membuat keputusan tentang parameter dari populasi tempat data sample diambil.   Lebih lanjut, statistika inferensia ini dapat dibagi menjadi statistika parametrik dan statistika nonparametrik.

Statistika parametrik adalah statistika yang di dalam pengolahan datanya menggunakan parameter yang spesifik seperti rata-rata populasi (μ) atau varians (σ2).  Pengambilan kesimpulan mengenai parameter tersebut didasarkan pada data yang ada pada sample. Misalnya, untuk menaksir parameter rata-rata populasi dipakai rata-rata beberapa sample.  Ini membutuhkan persyaratan-persyaratan tertentu.  Dengan kata lain, data sampel tersebut harus memenuhi syarat-syarat tertentu agar absah  untuk dijadikan dasar dalam penarikan kesimpulan mengenai parameter populasi tersebut.   Sebaliknya statistika non parametrik tidak memakai parameter tertentu di dalam pengolahan data untuk tujuan penarikan kesimpulan.  Oleh karena itu, metode ini tidak memerlukan syarat-syarat tertentu dari data sampelnya.

 


Ikuti

Get every new post delivered to your Inbox.

Bergabunglah dengan 50 pengikut lainnya.