STATISTIKA

2012 in review

Januari 2, 2013

The WordPress.com stats helper monkeys prepared a 2012 annual report for this blog.

Here’s an excerpt:

19,000 people fit into the new Barclays Center to see Jay-Z perform. This blog was viewed about 63,000 times in 2012. If it were a concert at the Barclays Center, it would take about 3 sold-out performances for that many people to see it.

Click here to see the complete report.

Ditulis dalam Statistik dan statistika | Leave a Comment »

Menguji Independensi antara 2 faktor

November 25, 2011

Independensi (keterkaitan) antara 2 faktor dapat diuji dengan uji chi square. Masalah independensi ini banyak mendapat perhatian hampir di semua bidang, baik eksakta maupun sosial ekonomi. Kita ambil contoh di bidang ekonomi dan pendidikan. Kita bisa menduga bahwa keadaan ekonomi seseorang tidak ada kaitannya dengan tingkat pendidikannya, atau justru sebaliknya bahwa keadaan ekonomi seseorang terkait erat dengan tingkat pendidikannya. Untuk menjawab dugaan-dugaan ini, kita bisa menggunakan uji chi square.

Langkah-langkahnya sebagai berikut.

1. Buatlah hipotesis

H0: tidak ada kaitan antara keadaan ekonomi seseorang dengan pendidikannya

HA: ada kaitan antara keadaan ekonomi seseorang dengan pendidikannya

2. Lakukan penelitian dan kumpulkan data

Hasil penelitian adalah sebagai berikut (tentatif).

Kategori	Di bawah garis kemiskinan	Di atas garis kemiskinan	Total
Tidak tamat SD	8	4	12
SD	20	17	37
SMP	15	16	31
SMA	3	23	26
Perguruan Tinggi	2	22	24
Total	48	82	130

3. Lakukan analisis

Kategori

Di bawah garis kemiskinan

Di atas garis kemiskinan

Total

Tidak tamat SD

4,43

7,57

13,66

23,34

SMP

11,45

19,55

SMA

9,60

16,40

Perguruan Tinggi

8,86

15,14

Total

130

Nilai O (Observasi) adalah nilai pengamatan di lapangan

Nilai E (expected) adalah nilai yang diharapkan, dihitung sbb:

1. Nilai E untuk kategori tidak tamat SD di bawah garis kemiskinan = (12 x 48)/130 = 4,43

2. Nilai E untuk kategori tidak tamat SD di atas garis kemiskinan = (12 x 82)/130 = 7,57

3. Nilai E untuk kategori SD di bawah garis kemiskinan = (37 x 48)/130 = 13,66

4. Nilai E untuk kategori SD di atas garis kemiskinan = (37 x 82)/130 = 23,34

5. Nilai E untuk kategori SMP di bawah garis kemiskinan = (31 x 48)/130 = 11,45

6. Nilai E untuk kategori SMP di atas garis kemiskinan = (31 x 82)/130 = 19,55

7. Nilai E untuk kategori SMA di bawah garis kemiskinan = (26 x 48)/130 = 9,60

8. Nilai E untuk kategori SMA di atas garis kemiskinan = (26 x 82)/130 = 16,40

9. Nilai E untuk kategori Perguruan Tinggi di bawah garis kemiskinan = (24 x 48)/130 = 8,86

10. Nilai E untuk kategori Perguruan Tinggi di atas garis kemiskinan = (24 x 82)/130 = 15,14

Hitung nilai Chi square ()

= Σ = + + … + =

2,875 + 1,683 + 2,941 + 1,721 + 1,103 + 0,646 + 4,538 + 2,656 + 5,313 + 3,110 = 26,586

= = = = = 9,488 (lihat table chi-square pada blog ini)

Catatan: k = kolom (di bawah & di atas garis kemiskinan) b = baris (tidak tamat SD, SD, SMP, SMA, dan Perguruan Tinggi)

4. Kriteria Pengambilan Kesimpulan

Terima H0, jika <

Terima HA, jika ≥

5. Kesimpulan

Hasil analisis menunjukkan bahwa nilai = 26,586, yaitu lebih besar darinilai yang 9,488, sehingga kita harus menerima HA. Dengan demikian, kita simpulkan bahwa ada kaitan yang signifikan antara keadaan ekonomi seseorang dengan tingkat pendidikannya (lihat lagi hipotesis di atas, khususnya bunyi hipotesis HA).

Catatan: kata signifikan berasal dari α = 0,05.

Ditulis dalam Uji Chi Square | Leave a Comment »

Uji Chi-Square

November 25, 2011

Uji Chi-square memiliki banyak kegunaan dalam pengujian. Setidaknya, uji ini dapat digunakan untuk lima keperluan pengujian. Uji ini banyak digunakan baik dalam bidang eksakta maupun dalam bidang sosial ekonomi. Berikut ini adalah beberapa penggunaan uji chi-square.

1. Menguji varians untuk data berdistribusi normal

2. Menguji proporsi untuk data multinomial dan binomial

3. Menguji independensi antara 2 faktor

4. Menguji heterogenitas

5. Menguji kesesuaian antara data dengan suatu model distribusi

Dari lima kegunaan di atas, tiga di antaranya sangat populer di kalangan para peneliti, yaitu menguji proporsi, menguji independensi, dan menguji heterogenitas. Oleh karena itu, di sini akan diberikan contoh penggunaan tiga jenis uji yang populer tersebut saja.

1. Menguji proporsi

Contoh: Menurut teori genetika (Hukum Mendel I) persilangan antara kacang kapri berbunga merah dengan yang berbunga putih akan menghasilkan tanaman dengan proporsi sebagai berikut: 25% berbunga merah, 50% berbunga merah jambu, dan 25% berbunga putih. Kemudian, dari suatu penelitian dengan kondisi yang sama, seorang peneliti memperoleh hasil sebagai berikut, 30 batang berbunga merah, 78 batang berbunga merah jambu, dan 40 batang berbunga putih. Pertanyaannya adalah apakah hasil penelitian si peneliti tersebut sesuai dengan Hukum Mendel atau tidak?

Untuk menjawab pertanyaan tersebut, kita bisa menggunakan uji chi-square, sebagai berikut:

1. Buatlah hipotesis

H0: rasio penelitian adalah 1:2:1 atau 25%:50%:25%

HA: rasio penelitian adalah rasio lainnya

2. Lakukan analisis

Kategori	Merah	Merah Jambu	Putih	Jumlah
Pengamatan (O)	30	78	40	148
Diharapkan (E)	37	74	37	148

Proporsi diharapkan (E) dicari berdasarkan rasio 1:2:1, sebagai berikut:

Merah = 1/4 x 148 = 37

Merah Jambu = 2/4 x 148 = 74

Putih = 1/4 x 148 = 37

= Σ = = 1,32 + 0,22 + 0,24 =1,78

= = = 5,99

Db = (kolom -1)(baris -1) = (3-1)(2-1) = 2

Kriteria Pengambilan Kesimpulan

Terima H0 jika <

Tolak H0 jik ≥

Kesimpulan

Dari hasil analisis data, diperoleh < , maka kita terima H0.

Artinya, rasio hasil penelitian si peneliti tersebut sesuai dengan rasio menurut Hukum Mendel (lihat bunyi hipotesis pada H0).

Ditulis dalam Uji Chi Square | 7 Comments »

Penggunaan Tabel Z

November 23, 2011

Contoh kasus adalah sebagai berikut

Rata-rata produktivitas padi di Aceh tahun 2009 adalah 6 ton per ha, dengan simpangan baku (s) 0,9 ton. Jika luas sawah di Aceh 100.000 ha dan produktivitas padi berdistribusi normal (data tentatif), tentukan

1. berapa luas sawah yang produktivitasnya lebih dari 8 ton ?

2. berapa luas sawah yang produktivitasnya kurang dari 5 ton ?

3. berapa luas sawah yang produktivitasnya antara 4 – 7 ton ?

Pertanyaan-pertanyaan di atas dapat dijawab dengan menggunakan sifat-sifat distribusi normal sebagaimana yang telah disusun pada Tabel Z.

Pertanyaan no.1 dapat dijawab sbb:

1. Hitung nilai z dari nilai x = 8 ton dengan rumus

2. Hitung luas di bawah kurva normal pada z = 2,22. Caranya buka Tabel Z dan lihat sel pada perpotongan baris 2,20 dan kolom 0,02. Hasilnya adalah angka 0,98679 dan bila dijadikan persen menjadi 98,679%. Angka ini menunjukkan bahwa luas di bawah kurva normal baku dari titik 2,22 ke kiri kurva adalah sebesar 98,679%. Karena luas seluruh di bawah kurva normal adalah 100%, maka luas dari titik 2,22 ke kanan kurva adalah 100% – 98,679% = 1,321% (arsir warna hitam pada gambar). Oleh karena itu, luas sawah yang produktivitasnya lebih dari 8 ton adalah 1,321%, yaitu (1,321/100) x 100.000 ha = 1321 ha.

Pertanyaan no.2 dapat dijawab sbb:

1. Hitung nilai z dari nilai x = 5 ton, dengan rumus

2. Hitung luas di bawah kurva normal pada z = -1,11. Caranya buka Tabel Z dan lihat sel pada perpotongan baris -1,10 dan kolom 0,01. Hasilnya adalah angka 0,13350 dan bila dijadikan persen menjadi 13,35%. Angka ini menunjukkan bahwa luas di bawah kurva normal baku dari titik -1,11 ke kiri kurva adalah sebesar 13,35% (diarsir warna hitam pada gambar). Oleh karena itu, luas sawah yang produktivitasnya kurang dari 5 ton adalah 13,35%, yaitu (13,35/100) x 100.000 ha = 13350 ha.

Pertanyaan no.3 dapat dijawab sbb:

1. Hitung nilai z dari nilai x = 4 ton, dengan rumus

2. Hitung nilai z dari nilai x = 7 ton, dengan rumus

3. Hitung luas di bawah kurva normal pada z = –2,22. Caranya buka Tabel Z dan lihat sel pada perpotongan baris –2,20 dan kolom 0,02. Hasilnya adalah angka 0,01321 dan bila dijadikan persen menjadi 1,321%. Angka ini menunjukkan bahwa luas di bawah kurva normal baku dari titik –2,22 ke kiri kurva adalah sebesar 1,321%.

4. Hitung luas di bawah kurva normal pada z = 1,11. Caranya buka Tabel Z dan lihat sel pada perpotongan baris 1,10 dan kolom 0,01. Hasilnya adalah angka 0,86650 dan bila dijadikan persen menjadi 86,65%. Angka ini menunjukkan bahwa luas di bawah kurva normal baku dari titik 1,11 ke kiri kurva adalah sebesar 86,65%.

5. Luas sawah yang produktivitasnya antara 4 – 7 ton adalah 86,65%-1,321% = 85,329% (diarsir warna hitam) atau (85,329/100) x 100.000 ha = 85329 ha.

Ditulis dalam Distribusi normal | 2 Comments »

Tabel Distribusi Frekuensi

November 22, 2011

Tabel distribusi frekuensi adalah salah satu bentuk penyajian data. Tabel distribusi frekuensi dibuat agar data yang telah dikumpulkan dalam jumlah yang sangat banyak dapat disajikan dalam bentuk yang jelas dan baik. Dengan kata lain, tabel distribusi frekuensi dibuat untuk menyederhanakan bentuk dan jumlah data sehingga ketika disajikan kepada para pembaca dapat dengan mudah dipahami atau dinilai.

Sebagai contoh, berikut ini pada Tabel 1 disajikan data nilai mahasiswa dalam mata kuliah statistika di suatu perguruan tinggi di Banda Aceh. Pada Tabel 1 di bawah, terdapat 60 data nilai mahasiswa. Ini tentu bukan jumlah yang terlalu banyak, karena kadang-kadang data itu dapat berjumlah sampai ribuan bahkan jutaan. Namun demikian, 60 buah data tersebut saja sudah dapat membuat kita repot untuk melihatnya, apa lagi menilainya.

Misalnya saja, anda diberikan data sebagaimana yang tertera pada Tabel 1 dan diminta untuk memberikan penilaian terhadap kinerja mahasiswa tersebut. Apakah mahasiswa di kelas tersebut termasuk mahasiswa yang pintar, sedang, atau kurang pintar dalam mata kuliah statistika?. Tentu, kita akan merasa agak kesulitan untuk memberikan penilaian, karena datanya banyak dan tidak tersusun.

Untuk membantu agar data ini bisa menjadi lebih sederhana, maka kita bisa menyajikannya dalam bentuk tabel distribusi frekuensi.

Tabel 1. Data nilai mata kuliah statistika mahasiswa STIK Pante Kulu Banda Aceh tahun 2011

52	56	62	48	93	88
42	53	61	61	71	64
53	51	58	63	71	57
58	63	88	62	67	56
56	47	63	78	67	53
33	80	45	55	37	42
50	42	56	58	67	22
28	56	31	71	50	25
50	41	35	79	69	46
47	26	47	51	67	42

Langkah-langkah dalam membuat tabel distribusi frekuensi adalah sebagai berikut:

1. Tentukan Rentang (R)

Rentang adalah selisih antara data terbesar dengan data terkecil. Untuk kasus ini, R = 93 – 22 = 71

2. Tentukan banyaknya Kelas Interval (KI)

Kelas Interval dapat ditentukan dengan aturan Sturges, yaitu

KI = 1 + 3,3 log n

Untuk kasus ini, n = 60, maka

KI = 1 + 3,3 x log 60 = 1 + 3,3 x 1,78 = 1 + 5,87 = 6,87 dibulatkan menjadi 7 kelas.

3. Tentukan Panjang Kelas Interval (PI)

Panjang Kelas Interval dapat ditentukan dengan cara membagi Rentang dengan Kelas Interval.

Untuk kasus ini, PI = R/KI = 71/7 = 10,14 dibulatkan menjadi 10.

4. Tentukan ujung bawah kelas pertama

Ujung bawah kelas pertama dapat ditentukan sbb:

a. ambil saja data yang paling kecil. Untuk kasus ini, 22

b. ambil data lebih kecil dari data terkecil, tetapi tidak melampaui panjang kelas. Untuk kasus ini boleh 13, 14, 15, 16, 17, 18, 19, 20, atau 21. Untuk kasus ini, kita pilih 21.

5. Tentukan selisih ujung atas suatu kelas dengan ujung bawah kelas berikutnya (S)

S adalah satuan terkecil dari data. Bila data ditulis tanpa desimal, maka S = 1, tetapi bila data ditulis dalam bentuk desimal, misalnya 67,5 … 92,4 ,maka S = 0,1. Untuk kasus ini, S =1.

Berikut, Tabel Distribusi Frekuensi dari data pada Tabel 1. di atas.

Nilai Ujian	Frekuensi Absolut	Frekuensi relatif
21 – 30	4	(4/60 )x100 = 6,67
31 – 40	4	6,67
41 – 50	14	23,33
51 – 60	16	26,67
61 – 70	13	21,67
71 – 80	6	10,00
81 – 90	2	3,33
91 – 100	1	1,67
Jumlah	60	100

Catatan : Biasanya banyaknya kelas interval akan bertambah satu. Dari hitungan langkah no. 2, KI = 7, tetapi kenyataannya KI = 8. Ini tidak mengapa.

Sajian data pada tabel distribusi frekuensi ini terlihat lebih ringkas dan lebih jelas. Dengan sangat cepat kita bisa melihat bahwa sebagian besar mahasiswa ( 43 orang atau 71,67%) nilainya berada pada rentang 41 – 70. Dengan demikian, mahasiswa kelas ini, kinerjanya berada pada kategori sedang, tidak terlalu baik, tapi juga tidak terlalu buruk.

Ditulis dalam Penyajian Data | 7 Comments »

STANDAR ERROR

Mei 21, 2011

Standar error adalah standar deviasi dari rata-rata. Bila kita mempunyai beberapa kelompok data, misalnya tiga kelompok, maka kita akan mempunyai tiga buah nila rata-rata. Bila kita hitung nilai standar deviasi dari tiga buah nilai rata-rata tersebut, maka nilai standar deviasi dari nilai rata-rata tersebut disebut nilai standar error. Simbol standar error untuk sampel adalah atau kadang-kadang ditulis SE.

Rumus menghitung nilai standar error adalah sebagai berikut

Contoh:

Kita mempunyai data jumlah anakan padi varietas Pandan Wangi sbb:

Sampel	I	II	III
1	28	30	36
2	32	30	40
3	15	27	31
4	21	22	26
5	22	24	30
6	17	20	24
7	17	17	22
8	14	15	14
9	29	27	31
10	28	30	39
11	27	26	36
12	29	23	31
Rata-rata	23.25	24.25	30

Secara teori, standar error adalah standar deviasi dari nilai rata-rata. Dari contoh di atas, nilai rata-rata ada 3 buah, yaitu 23,25 24,25 30. Oleh karenanya, bila kita hitung nilai standar deviasi dari ke tiga nilai tersebut, maka nilai itu disebut juga nilai standar error dari keseluruhan data di atas (lihat rumus menghitung standar deviasi di blog ini). Namun, untuk keperluan praktis, maka perhitungan nilai standar error tidak dihitung dari nilai rata-ratanya, tetapi langsung dihitung dari keseluruhan data dengan rumus seperti di atas.

Nilai standar error data di atas adalah

Untuk mencari nilai s², lihat cara menghitung varians di blog ini.

Ditulis dalam Dispersi, Statistika deskriptif | 10 Comments »

STANDAR DEVIASI

Mei 21, 2011

Standar deviasi disebut juga simpangan baku. Seperti halnya varians, standar deviasi juga merupakan suatu ukuran dispersi atau variasi. Standar deviasi merupakan ukuran dispersi yang paling banyak dipakai. Hal ini mungkin karena standar deviasi mempunyai satuan ukuran yang sama dengan satuan ukuran data asalnya. Misalnya, bila satuan data asalnya adalah cm, maka satuan standar deviasinya juga cm. Sebaliknya, varians memiliki satuan kuadrat dari data asalnya (misalnya cm²). Simbol standar deviasi untuk populasi adalah σ (baca: sigma) dan untuk sampel adalah s.

Rumus untuk menghitung standar deviasi adalah sebagai berikut

Contoh:

Data umur berbunga (hari) tanaman padi varietas Pandan Wangi adalah sbb: 84 86 89 92 82 86 89 92 80 86 87 90

Berapakah standar deviasi dari data di atas?

Sampel	y	y²
1	84	7056
2	86	7396
3	89	7921
4	92	8464
5	82	6724
6	86	7396
7	89	7921
8	92	8464
9	80	6400
10	86	7396
11	87	7569
12	90	8100
Jumlah	1043	90807

Maka nilai standar deviasi data di atas adalah

Ditulis dalam Dispersi, Statistika deskriptif | 45 Comments »

VARIANS

Mei 19, 2011

Varians adalah salah satu ukuran dispersi atau ukuran variasi. Varians dapat menggambarkan bagaimana berpencarnya suatu data kuantitatif. Varians diberi simbol σ² (baca: sigma kuadrat) untuk populasi dan untuk s²sampel.

Selanjutnya kita akan menggunakan simbol s² untuk varians karena umumnya kita hampir selalu berkutat dengan sampel dan jarang sekali berkecimpung dengan populasi.

Rumus untuk menghitung varians ada dua , yaitu rumus teoritis dan rumus kerja. Namun demikian, untuk mempersingkat tulisan ini, maka kita gunakan rumus kerja saja. Rumus kerja ini mempunyai kelebihan dibandingkan rumus teoritis, yaitu hasilnya lebih akurat dan lebih mudah mengerjakannya.

Rumus kerja untuk varians adalah sebagai berikut

Contoh

Data jumlah anakan padi varietas Pandan Wangi pada metode SRI adalah sebagai berikut

28 32 15 21 30 30 27 22 36 40

Sampel	y	y²
1	28	784
2	32	1024
3	15	225
4	21	441
5	30	900
6	30	900
7	27	729
8	22	484
9	36	1296
10	40	1600
Jumlah	281	8383

Maka nilai varians data di atas adalah

Ditulis dalam Dispersi | 2 Comments »

KUARTIL

April 14, 2011

Jika sekumpulan data dibagi menjadi empat bagian yang sama banyak, sesudah disusun menurut urutan nilainya, maka bilangan pembaginya disebut dengan kuartil. Simbol kuartil adalah K. Dengan demikian, ada tiga buah kuartil, yaitu K1, K2, dan K3. Pemberian nama dimulai dari nilai kuartil yang paling kecil. Untuk menentukan nilai kuartil, caranya adalah sebagai berikut.

1. Susun data menurut urutan nilainya, dari terkecil ke terbesar

2. Tentukan letak kuartil

3. Tentukan nilai kuartil

Letak kuartil ke-i, diberi lambang Ki, ditentukan dengan rumus sbb.

Contoh

Sampel data

27 30 28 29 22 25 24 23 24 25 27 31 21 26

Setelah disusun,

21 22 23 24 24 25 25 26 27 27 28 29 30 31

yaitu antara data ke-3 dengan data ke-4 dan 0,75 unit jauhnya dari data ke-3

Dengan demikian,

nilai K1 = data ke-3 + 0,75(data ke-4 - data ke-3)

K1 = 23 + 0,75(24-23) = 23,75

yaitu antara data ke-7 dengan data ke-8 dan 0,5 unit jauhnya dari data ke-7

Dengan demikian,

nilai K2 = data ke-7 + 0,5(data ke-8 - data ke-7)

K2 = 25 + 0,5(26-25) = 25,5

yaitu antara data ke-11 dengan data ke-12 dan 0,25 unit jauhnya dari data ke-11

Dengan demikian,

nilai K3 = data ke-11 + 0,25(data ke-12 - data ke-11)

K3 = 28 + 0,25(29-28) = 28,25

Ditulis dalam Statistika deskriptif | 10 Comments »

MEDIAN

April 14, 2011

Median adalah nilai yang terletak di tengah dari suatu data yang telah disusun secara berurutan. Jika banyaknya data adalah ganjil, maka median, setelah data disusun menurut nilainya, merupakan data paling tengah.

Contoh 1.

Data panjang malai padi Varietas Pandan Wangi adalah sebagai berikut (dalam cm)

27 30 28 29 22 25 24 23 24

Setelah disusun, susunan data menjadi

22 23 24 24 25 27 28 29 30

Data paling tengah adalah 25,

dengan demikian,

median dari data di atas adalah 25

Jika banyaknya data adalah genap, maka median, setelah data disusun menurut nilainya, merupakan rata-rata hitung dua data tengah.

Contoh 2.

Data jumlah butir per malai padi Varietas Pandan Wangi adalah sebagai berikut

181 144 162 139 145 184 138 100 170 141 151 107

Setelah disusun, susunan data menjadi

100

107

138

139

141

144

145

151

162

170

181

184

Data di tengah ada 2 buah, yaitu 144 dan 145,

dengan demikian,

median dari data jumlah butir padi per malai di atas adalah (144+145)/2 = 144,5

Ditulis dalam Statistika deskriptif | Leave a Comment »

STATISTIKA

2012 in review

Menguji Independensi antara 2 faktor

Uji Chi-Square

Penggunaan Tabel Z

Tabel Distribusi Frekuensi

STANDAR ERROR

STANDAR DEVIASI

VARIANS

KUARTIL

MEDIAN

Tabel Statistik

Kategori

Pesan

Top Posts & Pages

Blog Stats

52	56	62	48	93	88
42	53	61	61	71	64
53	51	58	63	71	57
58	63	88	62	67	56
56	47	63	78	67	53
33	80	45	55	37	42
50	42	56	58	67	22
28	56	31	71	50	25
50	41	35	79	69	46
47	26	47	51	67	42

52	56	62	48	93	88
42	53	61	61	71	64
53	51	58	63	71	57
58	63	88	62	67	56
56	47	63	78	67	53
33	80	45	55	37	42
50	42	56	58	67	22
28	56	31	71	50	25
50	41	35	79	69	46
47	26	47	51	67	42

52	56	62	48	93	88
42	53	61	61	71	64
53	51	58	63	71	57
58	63	88	62	67	56
56	47	63	78	67	53
33	80	45	55	37	42
50	42	56	58	67	22
28	56	31	71	50	25
50	41	35	79	69	46
47	26	47	51	67	42