Wednesday, June 24, 2020

Cara Mengategorikan Data Menggunakan SPSS

Mengategorikan data biasa dilakukan oleh para peneliti diawal pembahasan penelitian mereka, terutama penelitian yang melibatkan data dengan jumlah banyak. Pengategorian ini dimaksudkan untuk mempermudah pembaca dalam memahami struktur data yang ada. Biasanya pengategorian ini masih termasuk ke dalam analisa deskriptif yang dibarengi dengan memunculkan nilai rata-rata, nilai tengah, nilai yang paling sering muncul, dan lain sebagainya. Lebih lanjut, pengategorian data ini juga bisa dituangkan ke dalam bentuk visualisasi seperti histogram, bar chart, pie chart, dan lain sebagainya.

Hampir setiap penelitian yang menggunakan metode penelitian kuantitatif perlu melakukan pengategorian data. Contohnya seperti pada data dibawah ini:

Provinsi

Persentase Buta Huruf

ACEH

13,16

SUMATERA UTARA

10,84

SUMATERA BARAT

10,75

RIAU

7,94

JAMBI

17,47

SUMATERA SELATAN

11,11

BENGKULU

19,79

LAMPUNG

21,52

KEP. BANGKA BELITUNG

19,22

KEP RIAU

14,58

DKI JAKARTA

3,83

JAWA BARAT

15,78

JAWA TENGAH

34,89

DI YOGYAKARTA

31,73

JAWA TIMUR

40,27

BANTEN

17,48

BALI

42,63

NUSA TENGGARA BARAT

71,76

NUSA TENGGARA TIMUR

42,06

KALIMANTAN BARAT

38,49

KALIMANTAN TENGAH

11,51

KALIMANTAN SELATAN

17,2

KALIMANTAN TIMUR

13

KALIMANTAN UTARA

0

SULAWESI UTARA

2,42

SULAWESI TENGAH

16

SULAWESI SELATAN

45,5

SULAWESI TENGGARA

34,54

GORONTALO

15,88

SULAWESI BARAT

45,75

MALUKU

9,92

MALUKU UTARA

17,62

PAPUA BARAT

18,13

PAPUA

98,6

Data tersebut merupakan angka Persentase Buta Huruf di Indonesia pada tahun 2010 yang diambil dari laman resmi Badan Pusat Statistik (BPS). Jika data ditampilkan apa adanya pada sebuah penelitian, maka pembaca akan merasa bingung apa maksud dari data yang ditampilkan, atau kesimpulan apa yang bisa diambil dari data tersebut. Oleh karena itu diperlukan pengategorian data agar pembaca dapat memahami inti dari data yang ditampilkan.

Pada artikel kali ini, data Persentase Buta Huruf akan dikategorikan menjadi 3 kategori, dengan ketentuan sebagai berikut:
1. Angka buta huruf rendah: jika nilai dibawah atau sama dengan 3,00 (diberikan kode 0)
2. Angka buta huruf sedang: jika nilai diantara 3,01 sampai 40,00 (diberikan kode 1)
3. Angka buta huruf tinggi: jika nilai lebih dari 40,00 (diberikan kode 2)

Setelah ditentukan nilai pengelompokannya, berikutnya adalah langkah-langkah cara penyelesaian pengategorian kelompok dengan menggunakan software SPSS:

1. Memasukkan data
Sebelum memasukkan data, terlebih dahulu kita harus mendeskripsikan variabel yang ada. Masuk ke bagian "Variable View" yang terletak di pojok kiri bawah. Karena data yang ada terdiri dari dua variabel, maka deskripsikan kedua variabel tersebut dengan ketentuan sebagai berikut:
a. Variabel Provinsi
Name: Provinsi
Type: String
Width: 30
Decimal: 0
Label: (Dikosongkan)
Values: None
Missing: None
Columns: 8
Align: Left
Measure: Nominal


b. Variabel Persentase Buta Huruf
Name: Persentase_Buta_Huruf
Type: Numeric
Width: 8
Decimal: 2
Label: (Dikosongkan)
Values: None
Missing: None
Columns: 8
Align: Right
Measure: Scale
Pengisian Variable View

Kemudian pindah ke halaman Data View dan masukkan datanya sesuai nama variabelnya. Ingat! SPSS tidak bisa membaca data "spasi", maka jika ada nilai "spasi" ganti dengan nilai "underline ( _ )" atau nilai "spasi" nya dihapuskan. Misal mau memasukkan nilai "Jawa Tengah", maka dapat ditulis "Jawa_Tengah" atau "JawaTengah".
Pengisian Data View

2. Melakukan analisis
Pilih menu Transform => Recode Into Different Variables.
Menu Transform

Kemudian akan muncul kotak dialog Recode Into Different Variables, masukkan variabel yang nilainya akan dikelompokkan atau dalam artikel ini variabel Persentase_Buta_Huruf ke dalam bagian "Numeric Variable -> Output variable". Pada bagian Output Variable tuliskan nama variabel baru yang diinginkan, misalkan nama variabelnya Kategori, kemudian klik Change.
Kotak Dialog Recode Into Different Variables

Selanjutnya klik pada bagian Old and New Values sehingga akan muncul kotak dialog "Recode Into Different Variables: Old and New Values"pilih Range Lowest through diisi dengan 3.01 kemudian New Value diisi dengan 0 dan klik Add. Kemudian Range values through Highest diisi dengan 40, New Values diisi 2 dan klik Add. Untuk All other values masukkan angka 1 pada New Values dan klik Add. Kemudian klik Continue.
Kotak Dialog Recode Into Different Variables: Old and New Values

Setelah semuanya selesai, klik OK dan hasil pengategoriannya akan muncul pada bagian Data View.
Hasil Pengategorian

Hasil kategori ini bisa langsung dihitung yang kemudian dimasukkan ke dalam hasil penelitian seperti contoh tabel dibawah, atau bisa juga digunakan untuk analisis berikutnya seperti pembuatan visualisasi histogram, bar chart, pie chart, dan lain-lain.

Kategori Buta Huruf

Range

Jumlah Provinsi

Rendah

< 3.01

2

Sedang

3.01 - 40.00

26

Tinggi

> 40.00

6

Wednesday, May 6, 2020

Cara Membuat Cross Tabulation Menggunakan SPSS

Crosstab/Cross Tabulation (Tabulasi Silang) atau yang juga biasa disebut Tabel Kontigensi merupakan salah satu bentuk analisis deskriptif yang menggabungkan lebih dari satu variabel kedalam bentuk tabel. Crosstab bertujuan untuk meringkas informasi dari sekumpulan data kedalam bentuk tabel. Crosstab juga mempermudah pembaca dalam memahami kriteria data.

Crosstab dapat dibuat menggunakan software aritmatika pada umumnya seperti Microsoft Excel, namun membutuhkan banyak waktu untuk memahami maksud data dan mengolahnya kedalam bentuk Crosstab. Penggunaan software SPSS (Statistical Package for the Social Science) lebih direkomendasikan karena cara penggunaannya yang simpel dan menghasilkan output yang mudah dibaca atau dipahami. Oleh karena itu pada artikel kali ini kita akan membahas cara membuat Crosstab beserta penjelasan hasilnya.

Sebagai latihan, kita akan menggunakan contoh data sebagai berikut:
Data Studi Kasus
Data diatas merupakan contoh beberapa merk sepatu yang ada di sebuah pabrik sepatu dan akan didistribusikan ke toko yang berada di kota tertentu. Variabel Merk merupakan merk sepatu yang mana 0 artinya bermerk Tyrex, 1 artinya bermerk Donatello, dan 2 berarti merk Yongky Komaladi. Sedangkan variabel tujuan menandakan akan dikirim kemana sepatu tersebut, dengan tujuan Bandung jika kodenya 0 dan dikirim ke Surabaya jika berkode 1. Variabel tipe menunjukkan tipe sepatu apakah untuk laki-laki atau wanita, jika berkode 0 untuk sepatu laki-laki dan sepatu perempuan untuk kode 1. Variabel jumlah produk merupakan jumlah yang akan dikirimkan berdasarkan keterangan pada 3 variabel sebelumnya.

Misal pada baris pertama merk 0, tujuan 0, tipe 0, dan jumlah produk 886, maka dibaca merk Tyrex dengan tujuan pengiriman kota Bandung tipe sepatu laki-laki berjumlah 886 produk. Begitupun seterusnya. Kode 0, 1, dan 2 hanya bersifat sebagai pembeda antar objek. Jika kalian memiliki data yang hampir sama seperti ini, maka kalian bisa memberikan kode dengan angka berapapun. Setelah memahami komposisi data yang ada, kita akan memasuki tahap penyelesaian kasus menggunakan analisis Crosstab. Berikut langkah-langkahnya:

1. Buka aplikasi SPSS
Setelah lembar kerja SPSS terbuka, klik variable view yang ada di posisi pojok kiri bawah. Variable view ini berguna untuk mendefinisikan variabel yang akan dimasukkan.
Membuka Variabel View
2. Mendefinisikan Variabel
Masukkan definisi variabel satu persatu. Dimulai dari variabel Merk dengan ketentuan sebagai berikut:
Name: Merk (Nama variabel yang anda inginkan)
Type: Numeric (Pemilihan tipe tulisan. Pada kasus ini tulisan bersifat numerik)
Width: 8 (Banyaknya angka yang dikehendaki dalam satu baris)
Decimal: 0 (Banyak bilangan desimal yang diinginkan)
Label: *Dikosongkan saja
Missing: None (Nilai missing values yang dikehendaki)
Columns: 8 (Banyaknya angka yang dikehendaki dalam satu kolom. Biasanya Width = Columns)
Align: Right (Penyetaraan tulisan)
Measure: Scale (Pemilihan tipe data. Pada kasus ini data bersifat skala)
Values: Pada bagian values, klik pada bagian "titik tiga" seperti pada gambar dibawah.
Memasukkan Kriteria Nilai Value
Sehingga akan muncul kotak dialog Value Labels untuk memasukkan nilai Values. Masukkan nilai Value = 0 dan Label = Tyrex, kemudian klik Add. Seperti pada contoh gambar dibawah.
Kotak Dialog Value Labels
Setelah itu masukkan juga nilai Value = 1 dengan Label = Donatello, serta Value = 2 dengan Label = Yongky Komaladi. Hal ini sesuai dengan ketentuan studi kasus apabila merk sepatunya Tyrex maka akan diberikan kode 0, merk Donatello dengan kode 1, dan merk Yongky Komaladi dengan kode 2.
Kota Dialog Value Labels yang Sudah Terisi
Jika sudah, selanjutnya memasukkan variabel Tujuan, dengan ketentuan sebagai berikut:
Name: Tujuan (Nama variabel yang anda inginkan)
Type: Numeric (Pemilihan tipe tulisan. Pada kasus ini tulisan bersifat numerik)
Width: 8 (Banyaknya angka yang dikehendaki dalam satu baris)
Decimal: 0 (Banyak bilangan desimal yang diinginkan)
Label: *Dikosongkan saja
Missing: None (Nilai missing values yang dikehendaki)
Columns: 8 (Banyaknya angka yang dikehendaki dalam satu kolom. Biasanya Width = Columns)
Align: Right (Penyetaraan tulisan)
Measure: Scale (Pemilihan tipe data. Pada kasus ini data bersifat skala)
Values: 0 = Bandung, 1 = Surabaya (Masukkan nilainya dengan cara yang sama seperti pada variabel Merk)


Variabel Tipe:
Name: Tipe (Nama variabel yang anda inginkan)
Type: Numeric (Pemilihan tipe tulisan. Pada kasus ini tulisan bersifat numerik)
Width: 8 (Banyaknya angka yang dikehendaki dalam satu baris)
Decimal: 0 (Banyak bilangan desimal yang diinginkan)
Label: *Dikosongkan saja
Missing: None (Nilai missing values yang dikehendaki)
Columns: 8 (Banyaknya angka yang dikehendaki dalam satu kolom. Biasanya Width = Columns)
Align: Right (Penyetaraan tulisan)
Measure: Scale (Pemilihan tipe data. Pada kasus ini data bersifat skala)
Values: 0 = Laki-laki, 1 = Wanita (Masukkan nilainya dengan cara yang sama seperti pada variabel Merk)

Variabel Jumlah Produk:
Name: Jumlah_Produk (Nama variabel yang anda inginkan. SPSS tidak bisa membaca data spasi, maka gunakan under score ( _ ) untuk menggantikan fungsi spasi)
Type: Numeric (Pemilihan tipe tulisan. Pada kasus ini tulisan bersifat numerik)
Width: 8 (Banyaknya angka yang dikehendaki dalam satu baris)
Decimal: 0 (Banyak bilangan desimal yang diinginkan)
Label: *Dikosongkan saja
Missing: None (Nilai missing values yang dikehendaki)
Columns: 8 (Banyaknya angka yang dikehendaki dalam satu kolom. Biasanya Width = Columns)
Align: Right (Penyetaraan tulisan)
Measure: Scale (Pemilihan tipe data. Pada kasus ini data bersifat skala)
Values: None (Karena tidak ada yang perlu didefinisikan pada variabel jumlah produksi)
Nantinya semua variabel yang telah didefinisikan akan terlihat seperti ini:
Mendefinisikan Variabel

3. Memasukkan Data

Berpindahlah ke sheet Data View yang ada disebelah tulisan Variable View. Masukkan data satu persatu sesuai dengan ketentuan studi kasus. Jika data anda ada banyak dan tersimpan di file Microsoft Excel, maka anda bisa meng-copy dari Excel kemudian paste-kan kedalam lembar kerja SPSS. Namun lakukan copy paste data harus berdasarkan pervariabel.
Memasukkan Data ke Data View

4. Tahap Analisis Data

Klik Analyze → klik Descriptive Statistic → klik Crosstab. Setelah mengklik Crosstab maka akan muncul kotak dialog Crosstabs. Masukkan variabel merk ke kotak row(s), tipe ke kotak column(s) dan tujuan ke kotak layer dengan cara mengklik nama masing-masing variabel kemudian klik tanda panah yang berwarna biru. Setelah itu klik OK maka hasilnya akan keluar pada lembar output SPSS.
Kotak Dialog Crosstab

5. Hasil Analisis dan Pembahasan

Output Crosstab

Gambar diatas merupakan hasil tabel kontigensi 2x3x2. Dinamakan tabel kontigensi 2x3x2 dikarenakan susunan dari kiri ke kanan terdiri dari dua objek variabel Tujuan, kemudian tiga objek variabel Merk, dan dua objek variabel Tipe yang membentuk susunan Tujuan x Merk x Tipe = 2x3x2. Tabel terbagi menjadi dua baris besar yakni Bandung dan Surabaya. Dari masing-masing variabel tujuan tersebut terdapat masing-masing tiga baris merk dan dua kolom tipe. Jumlah data yang disajikan pada tabel ini menunjukan angka-angka yang relatif besar mencapai angka seribuan, hal ini dikarenakan praktikan sebelumnya menggunakan variabel jumlah_produk untuk menghitung frekuensinya.

Cara membaca tabelnya dimulai dari sebelah kiri ke kanan. Pada bagian tabel dengan tujuan Bandung, merk Tyrex dengan tipe laki-laki ada 886 data sedangkan untuk tipe wanita datanya kosong, sehingga total data yang ada pada merk Tyrex untuk semua tipe ada 886 data. Tujuan Bandung dengan Merk Donatello tipe laki-laki ada 824 data dan wanita ada 987 data dengan total keseluruhannya 1811 data. Tujuan Bandung Merk Yongky Komaladi tidak mempunyai data tipe laki-laki dan tipe wanitanya ada 715 data, sehingga total keseluruhan semua tipe ada 715 data. Untuk total keseluruhan data yang ada di tujuan Bandung untuk tipe laki-lakinya ada 1710 data dan 1702 untuk data wanita dengan total keseluruhan 3412 data untuk semua tipe dan semua merk.

Untuk bagian tabel dengan tujuan Surabaya, merk Tyrex dengan tipe laki-laki ada 119 data dan 837 data untuk wanita yang total keseluruhannya ada 956 data. Merk Donatello hanya mempunyai data tipe laki-laki sebanyak 397 data. Begitupun dengan merk Yongky Komaladi yang juga hanya memiliki data tipe laki-laki sebanyak 678 data. Total keseluruhan data yang ada pada tabel tujuan Surabaya sebanyak 2031 data untuk semua tipe dan merk dengan rincian total tipe laki-laki sebanyak 1194 data dan 837 data untuk keseluruhan tipe wanita.

Jika ditotal secara keseluruhan maka data untuk semua merk dengan tipe laki-laki ada 2.904 data dan 2539 data untuk tipe wanita serta total keseluruhan data yang ada untuk semua tujuan, merk dan tipe sebanyak 5443 data.


Sebagai penutup, Crosstab sangat direkomendasikan untuk penelitian yang menggunakan analisis deskriptif asalkan datanya memiliki minimal dua variabel syarat/objek dan satu variabel nilai. Sekian artikel tutorial kali ini, jika ada hal yang ingin ditanyakan silahkan bertanya melalui kolom komentar dibawah. Semoga bermanfaat!

Thursday, April 23, 2020

Makalah Tokoh-tokoh Statistika

Tradisi menghitung merupakan landasan utama dalam membangun peradaban. Pada peradaban Yunani, ilmu hitung sudah diperkenalkan dan menjadi dasar utama dalam proses pengambilan keputusan. Filsuf Yunani seperti Aristoteles maupun Plato, mengusulkan sistem pemilihan langsung terhadap pejabat publik, yang kemudian hari dikenal dengan demokrasi langsung. Aspek ilmu hitung menjadi dasar alat pembenar untuk menentukan siapa yang paling diterima oleh masyarakat dalam pemilihan tersebut.

Sekitar tahun 1645, Chevalier de Mere mengajukan beberapa permasalahan mengenai judi kepada seorang ahli matematika Perancis, Blaise Pascal (1623-1662) dan Descartes (1596-1650). Pascal yang seorang jenius dalam bidang matematika tertarik dengan permasalahan yang berlatar belakang teori ini dan kemudian mengadakan korespondensi dengan ahli matematika Perancis lainnya Piere de Fermat (1601-1665), dan keduanya mengembangkan cikal bakal teori peluang.

Selanjutnya perkembangan statistika mengalami kemajuan sangat pesat dan banyak diterapkan dalam berbagai disiplin ilmu. Sayangnya, banyak para statistikawan dimasa sekarang hanya menerapkan ilmu yang didapatkannya dari proses belajar tersebut tanpa mengetahui sejarah serta tokoh-tokoh yang telah menemukan dan mengembangkan teori tentang kestatistikaan. Oleh sebab itu, pada artikel kali ini penulis akan memaparkan tentang tokoh-tokoh statistika di dunia beserta jasa atau ilmu yang telah ditemukannya pada masa lampau.

Penggunaan Statistika sendiri sudah dikenal sebelum abad 18, pada saat itu negara-negara Babilonia, Mesir dan Roma mengeluarkan catatan tentang nama, usia, jenis kelamin, pekerjaan dan jumlah keluarga. Pada tahun 1500, pemerintah Inggris mengeluarkan catatan mingguan tentang kematian dan pada tahun 1662 dikembangkan catatan tentang kelahiran dan kematian. Sekitar tahun 1772 – 1791, G. Achenwall menggunakan istilah statistika sebagai kumpulan data tentang negara. Perkembangan Statistika dapat dikelompokkan menjadi tiga tahap didasarkan pada tokoh-tokoh yang mengembangkan statistika, yaitu:

Masa statistika awal:

1. Gottfried Achenwall (1719-1772)

Gottfried Achenwall lahir di Elbing, Provinsi Royal Prusia, Polandia pada tanggal 20 Oktober 1719. Ia kuliah di Universitas Leipzig dan mendapatkan gelar Master pada tahun 1746 pada Fakultas Filsafat Universitas Leipzig. Pada tahun yang sama, ia pergi ke Marburg untuk bekerja sebagai asisten profesor bidang sejarah dan hukum internasional. Pada tahun 1748 ia dipanggil oleh University of Göttingen untuk menjadi Profesor Luar Biasa bidang Filsafat. Ia juga dianugerahi gelar yang sama namun dalam bidang yang berbeda sebagai Profesor Luar Biasa bidang Hukum juga oleh Universitas yang sama pada tahun 1753. Pada tahun 1765, Achenwall menjadi court counsellordari Kerajaan Inggris dan Pengadilan Pemilihan Hanover. Ia menjadi terkenal karena menggunakan istilah “Statistik” untuk pertama kalinya pada karyanya yang berjudul Staatsverfassung der heutigen vornehmsten Europäischen Reiche und Völker im Grundrisse (Konstitusi Politik Negara dan Masyarakat Eropa Saat Ini) pada tahun 1749. Dalam karyanya ini, “Staatsverfassung der heutigen vornehmsten Europäischen Reiche und Völker im Grundrisse”, dia memberikan gambaran tentang konstitusi dari berbagai negara di Eropa dengan menggambarkan kondisi pertanian, manufaktur dan perdagangannya. Ia mendapatkan dukungan finansial dari Raja George III dalam melakukan penelitiannya.

Dalam bukunya tersebut, ia menggunakan istilah “Statistik” yang menggandung arti suatu deskripsi komprehensif dari sosial, politik, dan ekonomi suatu negara. Jadi pada waktu itu, statistik adalah suatu kegiatan yang berhubungan dalam proses analisis data kenegaraan. Atas jasanya ini, para ekonom Jerman memberi julukan “Bapak Statistika”.
Gottfried Achenwall


2. Sir John Sinclair (1754-1835)

Lahir pada 10 Mei 1754 di Thurso Castle, Thurso, Caithness. Sir John merupakan anak tertua dari George Sinclair dari Ulbster, yang merupakan keluarga Earls of Caithness. Setelah menyelesaikan kuliahnya di University of Edinburgh, University of Glasgow, dan Trinity College, Oxford, dia diterima di Fakultas Advokat di Skotlandia dan dipanggil ke English bar (semacam badan pelayanan hukum). Namun ia tidak pernah bekerja dengan sungguh-sungguh.

Pada tahun 1780 ia terpilih menjadi ke British House of Commons untuk Konstituen Caithness dan mewakili beberapa konstituen di Inggris. Karirnya dalam bidang politik terus menanjak sampai pada tahun 1811. Pada tahun tersebut ia kembali ke Edinburg untuk memperbaiki produksi wol di sana. Tidak hanya itu, ia juga berperan dalam pendirian Dewan Pertanian dan menjadi presiden yang pertama. Ia pun kemudian mendapat julukan “Agricultural Sir John”.

Minatnya dalam bidang pertanian sangatlah besar. Karyanya yang paling fenomenal adalah Statistical Account of Scotland, yang memberikan informasi tentang pertanian dan industri terkait, catatan tentang sejarah alam, dan statistik populasi. Bukunya (yang juga dikenal dengan Old Statistical Account) tersebut terdiri dari 21 volume dan diterbitkan dalam rentang waktu 1791-1799. Dalam bukunya tersebut ia memperkenalkan istilah baru, yakni “Statistics”, yang ia dengar ketika berkunjung ke Jerman. Pada volume XX, halaman xiii, Sir John Sinclair menulis ”Many people were at first surprised at my using the words “statistical” and “statistics”, as it was supposed that some in our own language might have expressed the same meaning. But in the course of a very extensive tour through the northern parts of Europe, which I happened to take in 1786, I found that in Germany they were engaged in a species of political enquiry to which they had given the name “statistics,” and though I apply a different meaning to that word—for by “statistical” is meant in Germany an inquiry for the purposes of ascertaining the political strength of a country or questions respecting matters of state—whereas the idea I annex to the term is an inquiry into the state of a country, for the purpose of ascertaining the quantum of happiness enjoyed by its inhabitants, and the means of its future improvement; but as I thought that a new word might attract more public attention, I resolved on adopting it, and I hope it is now completely naturalised and incorporated with our language”.

Dari tulisannya tersebut, Sir John Sinclair mengadopsi kata “Statistics” yang dia ketahui ketika melakukan perjalanan ke Jerman. Namun terdapat perbedaan antara keduanya. Di Jerman, istilah itu merujuk kepada suatu metode yang digunakan dalam hal politik dan kenegaraan, seperti misalnya untuk mengukur kekuatan politik dan menganalisis data-data kenegaraan. Sir John Sinclair menggunakan istilah ini (statistics) sebagai suatu metode untuk mengumpulkan data atau fakta di lapangan yang bersifat numerik. Pada tahun 1834, Statistical Society of London dibentuk (sekarang Royal Statistical Society). Ketika itu, ia adalah anggota tertua, yakni berusia 80 tahun.
Sir John Sinclair


3. Braham Demoivre (1667-1754)

Mengembangkan teori galat atau kekeliruan (theory of error).

4. Thomas Simpson

Pada tahun 1757 menyimpulkan bahwa terdapat suatu distribusi yang berlanjut (continues distribution) dari suatu variabel dalam suatu frekuensi banyak.

5. Pierre Simon de Laplace (1749-1827)

Mengembangkan konsep demoire dan simpson lebih lanjut dan menemukan distribusi normal. 

6. Francis Galton (1822-1911)

Menemukan distribusi lain yang bukan berupa kurva normal. Sir Francis Galton adalah sepupu Sir Douglas Galton, sepupu dua kali Charles Darwin, adalah seorang polymath Victoria Inggris, antropolog, egenetika, penjelajah tropis, geografer, penemu, ahli meteorologi, ahli proto-genetika, psychometrisian, dan statistikawan. Dia diberi gelar kebangsawanan pada tahun 1909.

Galton mempunyai produktifitas intelektual tinggi dan menghasilkan lebih dari 340 makalah dan buku sepanjang hidupnya. Ia juga menciptakan konsep statistik korelasi dan regresi. Dia adalah orang yang pertama untuk menerapkan metode statistik untuk mempelajari perbedaan manusia dalam hal warisan kecerdasan, dan memperkenalkan penggunaan kuesioner dan survei untuk mengumpulkan data tentang masyarakat, yang dibutuhkan untuk genelogikal dan biografi serta untuk studi antropometrik nya.

Dia adalah seorang pelopor dalam eugenika, mempopulerkan istilahnya sendiri Nature versus Nurture (alam vs pemeliharaan). Bukunya, Genius herediter (1869), adalah upaya jenius ilmiah pertama tentang sains sosial yg mempelajar kejeniusan dan kemegahan. Sebagai penyidik dari pikiran manusia, ia mendirikan psikometri (ilmu tentang mengukur kemampuan mental). dan psikologi diferensial. Dia menemukan metode untuk mengklasifikasikan sidik jari yang terbukti berguna dalam ilmu forensik.
Francis Galton


7. Karl Prederich Gauss (1777-1855)

Mengembangkan teknik kuadrat terkecil (least square) simpangan baku, galat baku untuk rata-rata (the standard error of mean). Lahir di Braunschweig, 30 April 1777 – meninggal di Göttingen, 23 Februari 1855 pada umur 77 tahun) adalah matematikawan, astronom, dan fisikawan Jerman yang memberikan beragam kontribusi; ia dipandang sebagai salah satu matematikawan terbesar sepanjang masa selain Archimedes dan Isaac Newton.

Saat umurnya belum genap 3 tahun, ia telah mampu mengoreksi kesalahan daftar gaji tukang batu ayahnya. Menurut sebuah cerita, pada umur 10 tahun, ia membuat gurunya terkagum-kagum dengan memberikan rumus untuk menghitung jumlah suatu deret aritmatika berupa penghitungan deret 1+2+3+…+100. Meski cerita ini hampir sepenuhnya benar, soal yang diberikan gurunya sebenarnya lebih sulit dari itu.

Gauss adalah ilmuwan dalam berbagai bidang: matematika, fisika, dan astronomi. Bidang analisis dan geometri menyumbang banyak sekali sumbangan-sumbangan pikiran Gauss dalam matematika. Kalkulus (termasuk limit) ialah salah satu bidang analisis yang juga menarik perhatiannya.

8. Blaise Pascal (1623-1662)

Berasal dari Perancis. Minat utamanya ialah filsafat dan agama, sedangkan hobinya yang lain adalah matematika dan geometri proyektif. Bersama dengan Pierre de Fermat menemukan teori tentang probabilitas. Pada awalnya minat riset dari Pascal lebih banyak pada bidang ilmu pengetahuan dan ilmu terapan, di mana dia telah berhasil menciptakan mesin penghitung yang dikenal pertama kali.

Pada tahun 1642, pada usia delapan belas Blaise Pascal menemukan kalkulator roda numerik yang disebut Pascaline untuk membantu ayahnya seorang penagih pajak menghitung pajak di Prancis. Kontribusi Pascal untuk komputasi diakui oleh ilmuwan komputer Nicklaus Wirth, yang pada tahun 1972 membuat bahasa pemrograman dengan nama Pascal.

Masa pengembangan:

1. Karl Pearson (1857-1936)

Melanjutkan konsep-konsep Galton dan mengembangkan konsep korelasi, regresi, distribusi Chi-Square dan analisis statistik kualitatif. Kontributor utama perkembangan awal statistika hingga sebagai disiplin ilmu tersendiri. Ia mendirikan Departemen Statistika Terapan di University College London pada tahun 1911 yang mana merupakan jurusan statistika pertama kali untuk tingkat universitas di dunia. Pearson menikah dengan Maria Sharpe pada tahun 1890, dan membuahkan 3 anak. Puteranya Egon Sharpe Pearson, menjadi penggantinya sebagai Ketua Departemen Statistika Terapan di University College.

Hasil karya Pearson adalah semua mencakup dalam hal aplikasi yang luas dalam pengembangan statistik matematis, yang mencakup bidang biologi, epidemiologi, antropometri, obat-obatan dan sejarah sosial.

Pada tahun 1901, dengan Weldon dan Galton, ia mendirikan jurnal Biometrika dimana objeknya adalah mengembangan teori statistik. Dia menjadi editor jurnal ini sampai kematiannya. Dia juga mendirikan jurnal Annals of Eugenics (sekarang Annals of Human Genetics) pada tahun 1925. Dia menerbitkan Drapers Company Research Memoirs sebagian besar untuk memberikan catatan output dari Departemen Statistik terapan dan tidak dipublikasikan di tempat lain. Buah pikiran Pearson banyak menopang metode statistik klasik yang umum digunakan sekarang ini. Contoh kontribusinya adalah: Koefisien korelasi, Metode momen, Sistem pearson pada kurva kontinu, Chi Distance, P-value, teori tes hipotesis dan teori statistik keputusan, Pearson Chi-Square tes, dan Principal componen analysis.
Karl Pearson


2. William Sealy Gosset (1876-1937)

Dikenal sebagai seorang ahli statistik, yang terkenal dengan nama penanya student dan untuk karyanya berupa distribusi t-Student. Lahir di Canterbury, Inggris. Dari orang pasangan Agnes Sealy Vidal dan Kolonel Frederic Gosset, Gosset belajar di Winchester College sebelum belajar kimia dan matematika di New College, Oxford. Pada saat lulus pada tahun 1899, ia bergabung dengan perusahaan pembuatan bir Dublin Arthur Guinness & Son. Disinilah ia menggunakan ilmu statistiknya di bidang pembuatan bir dan seleksi varietas di ladang gerst (semacam gandum untuk membuat bir). Gosset memperoleh ilmunya dengan belajar, trial dan error dan juga menghabiskan waktunya antara 1906-1907 di laboratorium biometrik milik Karl Pearson. Gosset dan Pearson memiliki hubungan yang baik, Pearson dibantu gosset dalam hal matematika dalam penulisan papernya. Pearson dibantu dengan 1980an paper tetapi ia memiliki apresiasi yang kecil terhadap pentingnya hal itu. Papernya ini sebagian besar membahas tentang pembuat bir dengan metode sampel kecil , sementara biometrician yang biasanya memiliki ratusan pengamatan dan melihat tidak ada urgensi dalam mengembangkan metode-sampel kecil.

Peneliti lain di Guinness sebelumnya sudah menerbitkan paper yang berisi rahasia dagang dari Guinness. Untuk mencegah pengungkapan informasi rahasia lebih lanjut, Guinness melarang karyawannya menerbitkan paper, apapun informasi yang terkandung didalamnya. Ini berarti bahwa Gosset tidak bisa menerbitkan karya-karyanya di bawah namanya sendiri. Karena itu ia menggunakan nama samaran ‘student’ untuk publikasinya untuk menghindari deteksi oleh pihak Guinness. Prestasi yang paling terkenal dari Gosset disebut sebagai distribusi t-Student.
William Sealy Gosset


3. Charles Spearman (1863-1945)

Murid dari Galton dan Leipzig mengembangkan konsep one factor model, selanjutnya dijuluki sebagai “the father of factor analysis”.
Charles Spearman


4. Godfrey Thompson (1881-1955), Cyril Burt (1883-1971), Raymond Cattel (1905-1998) dan Karl Holzinger (1892-1954)

Memberi kontribusi pada perluasan konsep analisis faktor dari Spearman. 

5. Harold Hotelling (1895-1955)

Memperluas konsep one factor model dari Spearman menjadi multiple factor model. 

6. Louis Guttman (1916-1987)

Mengembangkan skala yang dikenal dengan skala Guttman dan banyak memberikan kontribusi pada analisis faktor.

7. Ronald Alymer Fisher (1890-1962)

Mengembangkan desain eksperimen, di samping analisis varian dan kovarian, distribusi z, t uji signifikansi dan teori tentang perkiraan (theory of estimation). (17 Februari 1890 – 29 Juli 1962) ahli statistik, evolusi biologi, dan genetika Inggris.

Richard Dawkins menyebutnya “Pengganti Darwin terbesar”, dan ahli sejarah statistik Anders Hald menyebutkan “Fisher adalah seorang jenius yang dengan sendirian menciptakan dasar-dasar ilmu statistik modern”.

Beberapa sumbangan Fisher pada dunia statistik adalah prinsip desain eksperimen, maksimum likelihood, sufficiency, ancilarity, diskriminator linier fisher, dan fisher information. Dalam artikelnya tahun 1924 “On a distribution yielding the error functions of several well known statistics” diperkenalkan chi-square Karl Pearson dan t-student, hasil analisisnya yang lain adalah distribusi z (yang saat ini sangat dikenal bersama Distribusi F). Kontribusi ini membuatnya menjadi tokoh utama statistika abad 20.
Ronald Alymer Fisher


8. Rensis Likert (1932)

Mengembangkan skala yang dikenal dengan skala Likert.

9. Jan Tinbergen

Memperkenalkan ekonomic statistic pada tahun 1937.

Masa statistika modern

1. Andrey Kolmogorov (1903-1987) dan Smirnov (1900-1966)

Hasil karyannya dikenal dengan uji Kolmogorv-Smirnov. 

2. Neyman J. (1938)

Memberikan kontribusi pada Theory of Sampling Human Populations.

3. M.H. Hansen dan W.N. Hurwitz (1950)

Mengembangkan Theory of Sampling from Finite Populations.

4. Cohran, WG. (1953-1963) dan Taro Yamane (1967)

Mengembangkan Sampling Tecniques

5. Joreskog (1973), Kesling (1973), dan Wiley (1973)

Membentuk kesatuan model yang dikenal dengan persamaan struktural.

6. Prasanta Chandra Mahalanobis (1893-1972)

Berkontribusi dalam mengembangkan analisis peubah ganda. Salah satu kontribusinya yang besar adalah jarak Mahalanobis (D-statistik) yang merupakan ukuran jarak untuk data dengan variabel banyak yang digunakan dalam analisis klasifikasi. Mahalanobis juga pendiri jurnal statistik India yang sangat terkenal bernama Sankya. Pada tahun 1931 Mahalanobis mendirikan Indian Statistical Institute dengan salah satu divisinya bernama National Sample Survey (NSS) yang bertugas mengumpulkan data sosioekonomik dan demografi di seluruh India. Divisi ini membuat Mahalanobis mempunyai peranan penting dalam perencanaan ekonomi di India dan akhirnya NSS sekarang berfungsi sebagai bagian penting dari Ministry of Planning.

Pada tahun 1931 Hotelling memperkenalkan statistik T2 yang merupakan generalisasi dari statistik t-student untuk menguji hipotesis nilai tengah pada data peubah-ganda. Distribusi tak nol dari T2 adalah sama dengan Mahalanobis-Distance yang mempunyai tujuan berbeda ditemukan oleh Bose dan Roy pada tahun 1938.
Prasanta Chandra Mahalanobis


7. Ragnar Frisch (1895-1973)

Perkembangan statistika di bidang ekonomi yang dikenal dengan istilah ekonometrika dimulai tahun 1920 dipelopori Ragnar Frisch (3 March 1895 – 31 January 1973) dan Jan Tinbergen. Ekonometrika adalah cabang dari ilmu ekonomi yang merupakan integrasi antara ekonomi, matematika dan statistika. Walaupun demikian powerful perkembangan ekonometrika kurang mendapat sambutan hangat dari ekonom-ekonom besar yang kurang “sreg” dengan pemodelan termasuk John Maynard Keynes. Keynes memandang skeptis terhadap buku Tinbergen yang berjudul Statistical Testing for Business Cycle Theory. Baru di akhir tahun 1940 dan awal 1950 ekonometrika mulai berkembang lagi yang dipelopori oleh Chernoff, Haavelmo, Koopmans, Rubin dan Simon yang bekerja pada Cowles Commision for Research in Economics.

Peran statistika cukup besar dalam ekonometrika terutama dalam hal metode estimasi parameter model ekonometrika yang pada umumnya terdiri dari beberapa persamaan yang saling terkait (sistem persamaan simultan dan seemingly unrelated regression). Untuk mengestimasi parameter sistem persamaan simultan Hendri Theil tahun 1956 menemukan suatu metode 2SLS (two stage least squares). Kemudian pada tahun 1962 Zellner menemukan suatu metode SUR (Seemingly Unrelated Regression) untuk mengestimasi parameter model sistem persamaan regresi. Selanjutnya Theil bersama Zellner menemukan metode 3SLS (three stage least squares) untuk mengestimasi sistem persamaan simultan yang pada prinsipnya merupakan integrasi antara metode 2SLS dengan metode SUR. Model ekonometrika pada umumnya dibangun berdasarkan data yang bersifat time series, sehingga memunculkan model distribusi lag maupun autoregressive yang dikembangkan oleh Nerlove pada tahun 1972. Pada umumnya model-model tersebut terjadi pelanggaran asumsi klasik (autocorrelation, heteroscedasticity), sehingga belakangan muncul suatu model yang dikenal dengan ARCH (autoregressive and conditional heteroscedasticity).
Ragnar Frisch


8. Calyampudi Radhakrishna Rao.

Beliau adalah mahasiswa bimbingan dari Fisher. Rao bekerja di museum antropologi sambil menyelesaikan Ph.D tahun 1948. Tahun 1946 Rao mengembangkan fungsi diskriminan linear Fisher untuk klasifikasi dengan banyak grup. Selain itu Rao juga berkontribusi dalam mengembangkan matematika statistik dengan teorinya yang terkenal pertidaksamaan Rao-Cramer dan teorema Rao-Blackwell yang dikemukakan secara terpisah oleh Rao pada tahun 1945 dan Blackwell pada tahun 1947. Salah satu buku karangan Rao yang terkenal adalah Linear Statistical Inference yang telah diterjemahkan ke dalam 6 bahasa.

9. Genichi Taguchi (1924-2012).

Di bidang industri peran statistika yang menonjol adalah dalam bidang pengendalian kualitas dan penerapan rancangan percobaan factorial sebagian (fractional factorial) yang berusaha meminimumkan jumlah percobaan yang relatif mahal. Hal ini dapat kita kenal seperti pada metode Taguchi yang ditemukan oleh Dr. Genichi Taguchi dari Jepang sekitar tahun 1980 yang disebut juga off line quality control.
Genichi Taguchi


10. Bradley Efron.

Memperkenalkan metode bootstrap untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstraping ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan oleh Queneiville pada tahun 1948. Berhubung metode ini pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach. Pada dekade 80-an perkembangan metode non parametrik mulai sering digunakan seperti pada regresi nonparametrik, estimasi distribusi dengan kernel, dan neural network.
Bradley Efron

Para tokoh dari ketiga masa tersebut telah berjasa besar dalam ilmu statistika dimasa sekarang. Oleh karena itu, sudah seharusnya kita mengenal para tokoh tersebut sebagai wujud terimakasih kita kepada para tokoh yang telah memberikan jasanya di bidang ilmu statistika.


Sources: