2012 in review

Januari 2, 2013

The WordPress.com stats helper monkeys prepared a 2012 annual report for this blog.

Here’s an excerpt:

19,000 people fit into the new Barclays Center to see Jay-Z perform. This blog was viewed about 63,000 times in 2012. If it were a concert at the Barclays Center, it would take about 3 sold-out performances for that many people to see it.

Click here to see the complete report.

Menguji Independensi antara 2 faktor

November 25, 2011

Independensi (keterkaitan) antara 2 faktor dapat diuji dengan uji chi square.  Masalah independensi ini banyak mendapat perhatian hampir di semua bidang, baik eksakta maupun sosial ekonomi.  Kita ambil contoh di bidang ekonomi dan pendidikan.  Kita bisa menduga bahwa keadaan ekonomi seseorang tidak ada kaitannya dengan tingkat pendidikannya, atau justru sebaliknya bahwa keadaan ekonomi seseorang  terkait erat dengan tingkat pendidikannya.  Untuk menjawab dugaan-dugaan ini, kita bisa menggunakan uji chi square. 

 

Langkah-langkahnya sebagai berikut.

1. Buatlah hipotesis

    H0: tidak ada kaitan antara keadaan ekonomi seseorang dengan pendidikannya

    HA: ada kaitan antara keadaan ekonomi seseorang dengan pendidikannya

 

2.  Lakukan penelitian dan kumpulkan data

     Hasil penelitian adalah sebagai berikut (tentatif).

Kategori

Di bawah garis kemiskinan

Di atas garis kemiskinan

Total
Tidak tamat SD 8 4 12
SD 20 17 37
SMP 15 16 31
SMA 3 23 26
Perguruan Tinggi 2 22 24
Total 48 82 130

 

3. Lakukan analisis

Kategori

Di bawah garis kemiskinan

Di atas garis kemiskinan

Total

Tidak tamat SD

O

E

 

8

4,43

 

4

7,57

 

12

SD

O

E

 

20

13,66

 

17

23,34

 

37

SMP

O

E

 

15

11,45

 

16

19,55

 

31

SMA

O

E

 

3

9,60

 

23

16,40

 

26

Perguruan Tinggi

O

E

 

2

8,86

 

22

15,14

 

24

Total

48

82

130

 

Nilai O (Observasi) adalah nilai pengamatan di lapangan

Nilai E (expected) adalah nilai yang diharapkan, dihitung sbb:

1. Nilai E untuk kategori tidak tamat SD di bawah garis kemiskinan = (12 x 48)/130 = 4,43

2. Nilai E untuk kategori tidak tamat SD di atas garis kemiskinan = (12 x 82)/130 = 7,57

3. Nilai E untuk kategori SD di bawah garis kemiskinan = (37 x 48)/130 = 13,66

4. Nilai E untuk kategori SD di atas garis kemiskinan = (37 x 82)/130 = 23,34

5. Nilai E untuk kategori SMP di bawah garis kemiskinan = (31 x 48)/130 = 11,45

6. Nilai E untuk kategori SMP di atas garis kemiskinan = (31 x 82)/130 = 19,55

7. Nilai E untuk kategori SMA di bawah garis kemiskinan = (26 x 48)/130 = 9,60

8. Nilai E untuk kategori SMA di atas garis kemiskinan = (26 x 82)/130 = 16,40

9. Nilai E untuk kategori Perguruan Tinggi di bawah garis kemiskinan = (24 x 48)/130 = 8,86

10. Nilai E untuk kategori Perguruan Tinggi di atas garis kemiskinan = (24 x 82)/130 = 15,14

 

Hitung nilai Chi square (clip_image002[6])

clip_image002[4] = Σ clip_image004[4] = clip_image006[4] +clip_image008[4] + … + clip_image010[4] =

2,875 + 1,683 + 2,941 + 1,721 + 1,103 + 0,646 + 4,538 + 2,656 + 5,313 + 3,110 = 26,586

clip_image012[4] = clip_image014[4] = clip_image016[4] =clip_image018[4] = clip_image020[4] = 9,488 (lihat table chi-square pada blog ini)

Catatan: k = kolom (di bawah & di atas garis kemiskinan)   b = baris (tidak tamat SD, SD, SMP, SMA, dan Perguruan Tinggi)

 

4.  Kriteria Pengambilan Kesimpulan

Terima H0, jika clip_image002[8] < clip_image004[6]

Terima HA, jika clip_image002[9]clip_image004[7]

 

5. Kesimpulan

Hasil analisis menunjukkan bahwa nilai clip_image002[10] = 26,586, yaitu lebih besar dari nilai clip_image004[8] yang 9,488, sehingga kita harus menerima HA. Dengan demikian, kita simpulkan bahwa ada kaitan yang signifikan antara keadaan ekonomi seseorang dengan tingkat pendidikannya (lihat lagi hipotesis di atas, khususnya bunyi hipotesis HA).

Catatan: kata signifikan berasal dari α = 0,05.

Uji Chi-Square

November 25, 2011

Uji Chi-square memiliki banyak kegunaan dalam pengujian.  Setidaknya, uji ini dapat digunakan untuk lima keperluan pengujian. Uji ini banyak digunakan baik dalam bidang eksakta maupun dalam bidang sosial ekonomi.  Berikut ini adalah beberapa penggunaan uji chi-square.

1. Menguji varians untuk data berdistribusi normal

2. Menguji proporsi untuk data multinomial dan binomial

3. Menguji independensi antara 2 faktor

4. Menguji heterogenitas

5. Menguji kesesuaian antara data dengan suatu model distribusi

 

Dari lima kegunaan di atas, tiga di antaranya sangat populer di kalangan para peneliti, yaitu menguji proporsi, menguji independensi, dan menguji heterogenitas.  Oleh karena itu, di sini akan diberikan contoh penggunaan tiga jenis uji yang populer tersebut saja.

 

1.  Menguji proporsi

     Contoh: Menurut teori genetika (Hukum Mendel I)  persilangan antara kacang kapri berbunga merah dengan yang berbunga putih akan menghasilkan tanaman dengan proporsi sebagai berikut: 25% berbunga merah, 50% berbunga merah jambu, dan 25% berbunga putih.  Kemudian, dari suatu penelitian dengan kondisi yang sama,  seorang peneliti memperoleh hasil sebagai berikut, 30 batang berbunga merah, 78 batang berbunga merah jambu, dan 40 batang berbunga putih.  Pertanyaannya adalah apakah hasil penelitian si peneliti tersebut sesuai dengan Hukum Mendel atau tidak? 

Untuk menjawab pertanyaan tersebut, kita bisa menggunakan uji chi-square, sebagai berikut:

1.  Buatlah hipotesis

     H0: rasio penelitian adalah 1:2:1 atau 25%:50%:25%

     HA: rasio penelitian  adalah rasio lainnya

 

2.  Lakukan analisis

Kategori

Merah

Merah Jambu

Putih

Jumlah

Pengamatan (O)

30

78

40

148

Diharapkan (E)

37

74

37

148

Proporsi diharapkan (E) dicari berdasarkan rasio 1:2:1, sebagai berikut:

Merah             = 1/4 x 148 = 37

Merah Jambu  = 2/4 x 148 = 74

Putih               = 1/4 x 148 = 37

 

clip_image002[5] = Σ clip_image004 = clip_image006 = 1,32 + 0,22 + 0,24 =1,78

clip_image008= clip_image010 = clip_image012 = 5,99

Db = (kolom -1)(baris -1) = (3-1)(2-1) = 2

 

Kriteria Pengambilan Kesimpulan

Terima H0 jika  clip_image002[5] < clip_image008

Tolak H0 jik  clip_image002[5]clip_image008

 

Kesimpulan

Dari hasil analisis data, diperoleh clip_image002[5] < clip_image008, maka kita terima H0.

Artinya, rasio hasil penelitian si peneliti tersebut sesuai dengan rasio menurut Hukum Mendel (lihat bunyi hipotesis pada H0).

Penggunaan Tabel Z

November 23, 2011

Contoh kasus adalah sebagai berikut

Rata-rata produktivitas padi di Aceh tahun 2009 adalah 6 ton per ha, dengan simpangan baku (s) 0,9 ton.  Jika luas sawah di Aceh 100.000 ha dan produktivitas padi berdistribusi normal (data tentatif), tentukan

1. berapa luas sawah yang produktivitasnya lebih dari 8  ton ?

2. berapa luas sawah yang produktivitasnya kurang dari 5 ton ?

3. berapa luas sawah yang produktivitasnya antara 4 – 7 ton ?

 

Pertanyaan-pertanyaan di atas dapat dijawab dengan menggunakan sifat-sifat distribusi normal sebagaimana yang telah disusun pada Tabel Z.

Pertanyaan no.1 dapat dijawab sbb:

1. Hitung nilai z dari nilai x = 8 ton dengan rumus 

    clip_image002[10]

2. Hitung luas di bawah kurva normal pada z = 2,22.  Caranya buka Tabel Z dan lihat  sel pada perpotongan baris 2,20 dan kolom 0,02.  Hasilnya adalah angka 0,98679 dan bila dijadikan persen menjadi 98,679%.  Angka ini menunjukkan bahwa luas di bawah kurva normal baku dari titik 2,22 ke kiri kurva adalah sebesar 98,679%. Karena luas seluruh di bawah kurva normal adalah 100%, maka luas dari titik 2,22 ke kanan kurva adalah 100% – 98,679% = 1,321% (arsir warna hitam pada gambar).  Oleh karena itu, luas sawah yang produktivitasnya lebih dari 8 ton adalah 1,321%, yaitu (1,321/100) x 100.000 ha = 1321 ha.

kurva normal baku, 2,22

 

Pertanyaan no.2 dapat dijawab sbb:

1.  Hitung nilai z dari nilai x = 5 ton, dengan rumus

     clip_image002[12]

2.  Hitung luas di bawah kurva normal pada z = -1,11.  Caranya buka Tabel Z dan lihat  sel pada perpotongan baris -1,10 dan kolom 0,01.  Hasilnya adalah angka 0,13350 dan bila dijadikan persen menjadi 13,35%.  Angka ini menunjukkan bahwa luas di bawah kurva normal baku dari titik -1,11 ke kiri kurva adalah sebesar 13,35% (diarsir warna hitam pada gambar).  Oleh karena itu, luas sawah yang produktivitasnya kurang dari 5 ton adalah 13,35%, yaitu (13,35/100) x 100.000 ha = 13350 ha.

kurva normal baku 1,11

 

Pertanyaan no.3 dapat dijawab sbb:

1. Hitung nilai z dari nilai x = 4 ton, dengan rumus

     clip_image002[1]

2. Hitung nilai z dari nilai x = 7 ton, dengan rumus

    clip_image002[3]

3.  Hitung luas di bawah kurva normal pada z = –2,22.  Caranya buka Tabel Z dan lihat  sel pada perpotongan baris –2,20 dan kolom 0,02.  Hasilnya adalah angka 0,01321 dan bila dijadikan persen menjadi 1,321%.  Angka ini menunjukkan bahwa luas di bawah kurva normal baku dari titik –2,22 ke kiri kurva adalah sebesar 1,321%.

4. Hitung luas di bawah kurva normal pada z = 1,11.  Caranya buka Tabel Z dan lihat  sel pada perpotongan baris 1,10 dan kolom 0,01.  Hasilnya adalah angka 0,86650 dan bila dijadikan persen menjadi 86,65%.  Angka ini menunjukkan bahwa luas di bawah kurva normal baku dari titik 1,11 ke kiri kurva adalah sebesar 86,65%.

5. Luas sawah yang produktivitasnya antara 4 – 7 ton adalah 86,65%-1,321% = 85,329% (diarsir warna hitam) atau (85,329/100) x 100.000 ha = 85329 ha.

    

kurva normal baku, -2,22 sd 1,11

Tabel Distribusi Frekuensi

November 22, 2011
Tabel distribusi frekuensi adalah salah satu bentuk penyajian data. Tabel distribusi frekuensi dibuat agar data yang telah dikumpulkan dalam jumlah yang sangat banyak dapat disajikan dalam bentuk yang jelas dan baik. Dengan kata lain, tabel distribusi frekuensi  dibuat untuk menyederhanakan bentuk dan jumlah data sehingga ketika disajikan kepada para pembaca dapat dengan mudah dipahami atau dinilai.
 
Sebagai contoh, berikut ini pada Tabel 1  disajikan data nilai mahasiswa dalam  mata kuliah statistika di suatu perguruan tinggi di Banda Aceh.  Pada Tabel 1 di bawah, terdapat  60 data nilai mahasiswa.  Ini tentu bukan jumlah yang terlalu banyak, karena kadang-kadang data itu dapat berjumlah sampai ribuan bahkan jutaan.  Namun demikian, 60 buah data tersebut saja sudah dapat membuat kita repot untuk melihatnya, apa lagi menilainya. 
 
Misalnya saja, anda diberikan data sebagaimana yang tertera pada Tabel 1 dan diminta untuk memberikan penilaian terhadap kinerja mahasiswa tersebut.  Apakah mahasiswa di kelas tersebut termasuk mahasiswa yang pintar, sedang, atau kurang pintar dalam mata kuliah statistika?.  Tentu, kita akan merasa agak kesulitan untuk memberikan penilaian, karena datanya  banyak dan tidak tersusun.
 
Untuk membantu agar data ini bisa menjadi lebih sederhana, maka kita bisa menyajikannya dalam bentuk tabel distribusi frekuensi. 
 
Tabel 1. Data nilai mata kuliah statistika mahasiswa STIK Pante Kulu Banda Aceh tahun 2011

52

56

62

48

93

88

42

53

61

61

71

64

53

51

58

63

71

57

58

63

88

62

67

56

56

47

63

78

67

53

33

80

45

55

37

42

50

42

56

58

67

22

28

56

31

71

50

25

50

41

35

79

69

46

47

26

47

51

67

42

 
 
Langkah-langkah dalam membuat tabel distribusi frekuensi adalah sebagai berikut:
1. Tentukan Rentang (R)
     Rentang adalah selisih antara data terbesar dengan data terkecil.  Untuk kasus ini, R = 93 – 22 = 71
 
2. Tentukan banyaknya Kelas Interval (KI)
     Kelas Interval dapat ditentukan dengan aturan Sturges, yaitu
     KI = 1 + 3,3 log n
     Untuk kasus ini, n = 60, maka
     KI = 1 + 3,3 x log 60 = 1 + 3,3 x 1,78 = 1 + 5,87 = 6,87 dibulatkan menjadi 7 kelas.
 
3. Tentukan Panjang Kelas Interval (PI)
      Panjang Kelas Interval dapat ditentukan dengan cara membagi Rentang dengan Kelas Interval.
      Untuk kasus ini, PI = R/KI = 71/7 = 10,14 dibulatkan menjadi 10.
 
4.  Tentukan ujung bawah kelas pertama
      Ujung bawah kelas pertama dapat ditentukan sbb:
      a. ambil saja data yang paling kecil.  Untuk kasus ini, 22
      b. ambil data lebih kecil dari data terkecil, tetapi tidak melampaui panjang kelas.  Untuk kasus ini boleh 13, 14, 15, 16, 17, 18, 19, 20, atau 21.  Untuk kasus ini, kita pilih 21.
 
5.  Tentukan selisih ujung atas suatu kelas dengan ujung bawah kelas berikutnya (S)
      S adalah satuan terkecil dari data.  Bila data ditulis tanpa desimal, maka S = 1, tetapi bila data ditulis dalam bentuk desimal, misalnya 67,5  … 92,4 ,maka S = 0,1.  Untuk kasus ini, S =1.
 
Berikut,  Tabel Distribusi Frekuensi dari data pada Tabel 1. di atas.

Nilai Ujian

Frekuensi Absolut

Frekuensi relatif

21 – 30

4

(4/60 )x100 = 6,67

31 – 40

4

6,67

41 – 50

14

23,33

51 – 60

16

26,67

61 – 70

13

21,67

71 – 80

6

10,00

81 – 90

2

3,33

91 – 100

1

1,67

Jumlah

60

100

Catatan : Biasanya banyaknya kelas interval akan bertambah satu.  Dari hitungan langkah no. 2, KI = 7, tetapi kenyataannya KI = 8.   Ini tidak mengapa.
 
Sajian data pada tabel distribusi frekuensi ini terlihat lebih ringkas dan lebih jelas.  Dengan sangat cepat kita bisa melihat bahwa sebagian besar mahasiswa ( 43 orang atau 71,67%) nilainya berada pada rentang 41 – 70.  Dengan demikian, mahasiswa kelas ini, kinerjanya berada pada kategori sedang, tidak terlalu baik, tapi juga tidak terlalu buruk.
             

STANDAR ERROR

Mei 21, 2011

Standar error adalah standar deviasi dari rata-rata.  Bila kita mempunyai beberapa kelompok data, misalnya tiga kelompok, maka kita akan mempunyai tiga buah nila rata-rata.  Bila kita hitung nilai standar deviasi dari tiga buah nilai rata-rata tersebut, maka nilai standar deviasi dari nilai rata-rata tersebut disebut nilai standar error.  Simbol standar error untuk sampel adalah clip_image002 atau kadang-kadang ditulis SE.

Rumus menghitung nilai standar error adalah sebagai berikut

rumus se

Contoh:

Kita mempunyai data jumlah anakan padi varietas Pandan Wangi sbb:

Sampel

I

II

III

1

28

30

36

2

32

30

40

3

15

27

31

4

21

22

26

5

22

24

30

6

17

20

24

7

17

17

22

8

14

15

14

9

29

27

31

10

28

30

39

11

27

26

36

12

29

23

31

Rata-rata

23.25

24.25

30

 

Secara teori, standar error adalah standar deviasi dari nilai rata-rata.  Dari contoh di atas, nilai rata-rata ada 3 buah, yaitu 23,25  24,25  30.  Oleh karenanya, bila kita hitung nilai standar deviasi dari ke tiga nilai tersebut, maka nilai itu disebut juga nilai standar error dari keseluruhan data di atas (lihat rumus menghitung standar deviasi di blog ini).  Namun, untuk keperluan praktis, maka perhitungan nilai standar error tidak dihitung dari nilai rata-ratanya, tetapi langsung dihitung dari keseluruhan data dengan rumus seperti di atas.

Nilai standar error data di atas adalah

nilai se

Untuk mencari nilai s2, lihat cara menghitung varians di blog ini.

STANDAR DEVIASI

Mei 21, 2011

Standar deviasi disebut juga simpangan baku.  Seperti halnya varians, standar deviasi juga merupakan suatu ukuran dispersi atau variasi.  Standar deviasi merupakan ukuran dispersi yang paling banyak dipakai.  Hal ini mungkin karena standar deviasi mempunyai satuan ukuran yang sama dengan satuan ukuran data asalnya.  Misalnya, bila satuan data asalnya adalah cm, maka satuan standar deviasinya juga cm.  Sebaliknya, varians memiliki satuan kuadrat dari data asalnya (misalnya cm2).  Simbol standar deviasi untuk populasi adalah σ (baca: sigma) dan untuk sampel adalah s.

Rumus untuk menghitung standar deviasi adalah sebagai berikut

rumus std

 

Contoh:

Data umur berbunga (hari) tanaman padi varietas  Pandan Wangi adalah sbb: 84  86  89  92  82  86  89  92  80  86  87 90

Berapakah standar deviasi dari data di atas?

 

Sampel

y

y2

1

84

7056

2

86

7396

3

89

7921

4

92

8464

5

82

6724

6

86

7396

7

89

7921

8

92

8464

9

80

6400

10

86

7396

11

87

7569

12

90

8100

Jumlah

1043

90807

 

Maka nilai standar deviasi data di atas adalah

nilai std

VARIANS

Mei 19, 2011

Varians adalah salah satu ukuran dispersi atau ukuran variasi.  Varians dapat menggambarkan bagaimana berpencarnya suatu data kuantitatif.  Varians diberi simbol  σ2 (baca: sigma kuadrat) untuk populasi dan untuk s2 sampel. 

Selanjutnya kita akan menggunakan simbol s2  untuk varians karena umumnya kita hampir selalu berkutat dengan sampel dan jarang sekali berkecimpung dengan populasi.

Rumus untuk menghitung varians ada dua , yaitu rumus teoritis dan rumus  kerja.  Namun demikian, untuk mempersingkat  tulisan ini, maka kita gunakan rumus kerja saja.  Rumus kerja ini mempunyai kelebihan dibandingkan rumus teoritis, yaitu hasilnya lebih akurat dan lebih mudah mengerjakannya.

 

Rumus kerja untuk varians adalah sebagai berikut

r.varians3

Contoh

Data jumlah anakan  padi varietas Pandan Wangi pada metode SRI adalah sebagai berikut

28  32  15  21  30  30  27  22  36  40

Sampel

y

y2

1

28

784

2

32

1024

3

15

225

4

21

441

5

30

900

6

30

900

7

27

729

8

22

484

9

36

1296

10

40

1600

Jumlah

281

8383

 
Maka nilai varians data di atas adalah
 
nilai var

KUARTIL

April 14, 2011

Jika sekumpulan data dibagi menjadi empat bagian yang sama banyak, sesudah disusun menurut urutan nilainya, maka bilangan pembaginya disebut dengan kuartil.  Simbol kuartil adalah K.  Dengan demikian, ada tiga buah kuartil, yaitu K1, K2, dan K3.  Pemberian nama dimulai dari nilai kuartil yang paling kecil.  Untuk menentukan nilai kuartil, caranya adalah sebagai berikut.

1. Susun data menurut urutan nilainya, dari terkecil ke terbesar

2. Tentukan letak kuartil

3. Tentukan nilai kuartil

 

Letak kuartil ke-i, diberi lambang Ki, ditentukan dengan rumus sbb.

rumus K

Contoh

Sampel data

27  30  28  29  22  25  24  23  24  25   27  31  21  26

Setelah disusun,

21  22  23  24  24  25  25  26  27  27  28   29  30  31

rumus k1

yaitu antara data ke-3 dengan data ke-4 dan 0,75 unit jauhnya dari data ke-3

Dengan demikian,

nilai K1 = data ke-3 + 0,75(data ke-4  -  data ke-3)

       K1 = 23 + 0,75(24-23) = 23,75

 

rumus k2

yaitu antara data ke-7 dengan data ke-8 dan 0,5 unit jauhnya dari data ke-7

Dengan demikian,

nilai K2 = data ke-7 + 0,5(data ke-8  -  data ke-7)

       K2 = 25 + 0,5(26-25) = 25,5

 

rumus k3

yaitu antara data ke-11 dengan data ke-12 dan 0,25 unit jauhnya dari data ke-11

Dengan demikian,

nilai K3 = data ke-11 + 0,25(data ke-12  -  data ke-11)

       K3 = 28 + 0,25(29-28) = 28,25

MEDIAN

April 14, 2011

Median adalah nilai yang terletak di tengah dari suatu data yang telah disusun secara berurutan. Jika banyaknya data adalah ganjil, maka median, setelah data disusun menurut nilainya, merupakan data paling tengah.

Contoh 1.

Data panjang malai padi Varietas Pandan Wangi adalah sebagai berikut (dalam cm)

27 30 28 29 22 25 24 23 24

Setelah disusun, susunan data menjadi

22 23 24 24 25 27 28 29 30

Data paling tengah adalah 25,

dengan demikian,

median dari data di atas adalah 25

Jika banyaknya data adalah genap, maka median, setelah data disusun menurut nilainya, merupakan rata-rata hitung dua data tengah.

Contoh 2.

Data jumlah butir per malai padi Varietas Pandan Wangi adalah sebagai berikut

181 144 162 139 145 184 138 100 170 141 151 107

Setelah disusun, susunan data menjadi

100

107

138

139

141

144

145

151

162

170

181

184

Data di tengah ada 2 buah, yaitu 144 dan 145,

dengan demikian,

median dari data jumlah butir padi per malai di atas adalah (144+145)/2 = 144,5