Konten dari Pengguna

Software-software Statistik

Pardomuan Robinson Sihombing
Seorang ASN, Fungsional Statistisi Ahli Muda, yang bekerja di Badan Pusat Statistik (BPS) Jakarta. Lulusan D-IV statistika ekonomi STIS dan S2 statistika terapan Unpad. Saat ini, melanjutkan studi doktoral statistika dan sains data di IPB University
22 Agustus 2021 21:16 WIB
comment
2
sosmed-whatsapp-white
copy-link-circle
more-vertical
Tulisan dari Pardomuan Robinson Sihombing tidak mewakili pandangan dari redaksi kumparan
Ilustrasi Software (Sumber: https://pixabay.com/id/illustrations/search/software/)
zoom-in-whitePerbesar
Ilustrasi Software (Sumber: https://pixabay.com/id/illustrations/search/software/)
ADVERTISEMENT
Dalam penggunaan aplikasi model statistik, sering kali kita terkendala dengan banyaknya data dan kompleksitas pemodelan yang ada. Sehingga tidak memungkinkan lagi menganalisa data secara manual. Mungkin untuk data yang sedikit dan model yang sederhana masih memungkinkan menggunakan kalkulator maupun aplikasi microsoft excel. Tetapi untuk data yang lebih besar dan model yang lebih kompleks kita membutuhkan aplikasi yang khusus dirancang untuk analisis model-model statistik.
ADVERTISEMENT
Jenis Software Statistik
Secara umum ada dua jenis software statistik yaitu yang berbayar (Commercial Software) dan yang tidak berbayar/gratis (non commercial software). Software yang tidak berbayar dapat kita bagi lagi menjadi dua yaitu Freeware (Free Software) dan Open Source Software (OSS). Yang dimaksud freeware ialah software yang dapat diperoleh dengan gratis tetapi kita tidak dapat menambahkan atau memodifikasi menu yang ada di dalam software tersebut. Sedangkan software yang open source, kita dapat berkontribusi dalam menambahkan atau memodifikasi menu yang ada melalui packages yang tersedia.
Jika dilihat dari tampilan penggunaan software dapat dibagi menjadi tiga yaitu berbasis menu, berbasis sintaks (command) dan kombinasi keduanya. Contoh software statistik berbasis menu yang berbayar seperti SPSS, Eviews, Statistica, Systat, Amos, SmartPLS, rapidminer dan lainnya, sedangkan yang tidak berbayar seperti PSPP, openstat, mystat, gretl dan lainnya. Contoh software statistik yang berbasis syntax (command) yang berbayar seperti SAS, Lisrel, S-Plus, dan lainnya, sedangkan yang tidak berbayar seperti software R, Winbugs, dan lainnya. Contoh software statistik yang berbasis kombinasi menu dan sintaks yang berbayar seperti STATA dan minitab, sedangkan yang tidak berbayar seperti JASP dan lainnya . Masing-masing software statistik yang digunakan memiliki kekurangan dan kelebihan masing-masing. Kita akan membahas beberapa aplikasi statistik yang populer digunakan secara umum.
ADVERTISEMENT
Software Statistik Berbayar
Aplikasi yang umum digunakan dalam dunia statistik adalah Statistical Package for the Social Sciences (SPSS). SPSS dikembangkan oleh Norman H. Nie dan C. Hadlai Hull tahun 1968. Saat ini versi terbarunya adalah SPSS 28 (https://www.ibm.com/products/spss-statistics). Software ini unggul untuk metode-metode statistik yang menggunakan data cross section baik untuk model berbasis normal maupun keluarga ekponensial (model GLM) maupun pengembangannya model GLMM dan GEE. Dari sisi metode estimasi sudah memasukkan pendekatan bayesian di dalam tools analisisnya. Selain itu uji komparasi statistik nonparametriknya sangat lengkap. Dalam model ini juga sudah memasukkan analisis spasial. Kekurangan dalam software ini kita belum dapat melakukan analisis-analisis time series dan analisis data panel.
Software statistik kedua yang sering dipakai adalah Minitab. Minitab dikembangkan oleh periset Barbara F. Ryan, Thomas A. Ryan, Jr., dan Brian L. Joiner pada tahun 1972. Saat ini versi terbarunya adalah Minitab 20 (https://www.minitab.com/en-us/). Sama seperti SPSS, software ini unggul untuk model dengan data cross section. Selain itu ciri khas dan keunggulan spesifik software ini adalah untuk analisis rancangan percobaan seperti Design of Experiment (DOE) dan quality control.
ADVERTISEMENT
Software statistik ketiga yang sering dipakai adalah Econometric Views (Eviews). EViews dikembangkan oleh Engel-Granger tahun 1994. Saat ini versi terbarunya Eviews 12 (https://eviews.com/home.html). Keunggunalan software Eviews adalah untuk ekonometrika khususnya model-model time series. Dalam software ini juga telah memasukkan teknik variabel selection seperti LASSO, RIDGE dan Elastics Net. Software ini juga memiliki keunggulan dalam analisis data panel, dimana penanganan data panel cukup lengkap baik statis maupun dinamis panel. Hanya saja model data panel yang digunakan masih berbasis data yang berdistribusi normal belum termasuk model panel untuk model GLM.
Software statistik keempat yang sering dipakai untuk data primer khususnya untuk model SEM (struktural equation model) adalah adalah AMOS, Lisrel dan SmartPLS. Amos dan Lisrel berbasis data yang berdistribusi normal dan menganalisis berdasarkan struktur kovarian matrik. Edisi AMOS mengikuti perkembangan edisi SPSS (https://www.ibm.com/products/structural-equation-modeling-sem) yaitu AMOS 27, dan edisi terbaru Lisrel adalah Lisrel 11 (https://ssicentral.com/index.php/products/lisrel/). Sedangkan SmartPLS tidak mengisyarakat distribusi data, menggunakan struktur korelasi matrik dan dalam mengestimasi parameter menggunakan teknik bootstraping. Edisi terbarunya adalah versi SmartPLS 3.3 (https://www.smartpls.com/). Kelebihan lain dari SmartPLS dapat digunakan untuk model hubungan formatif maupun reflektif. Selain itu dapat digunakan untuk data sekunder, dan dapat dengan mudah menggunakan model hubungan mediasi/ intervening, moderasi, kuadratik dan multi group analysis.
ADVERTISEMENT
Software statistik kelima yang sering dipakai adalah Statistics and Data (STATA). Stata dikembangkan oleh perusahaan StataCorp pada tahun 1985. Versi terbarunya adalah STATA 17 (stata.com). Software ini terbilang software yang cukup lengkap. STATA dapat mengolah baik data primer (model SEM dan laten class variable) maupun dengan data sekunder. Model-model data cross section, time series dan panel juga tersedia, tidak hanya terbatas untuk model berbasis normal, juga tersedia yang berbasis keluarga eksponensial (GLM) maupun model regresi nonparametrik. Teknik analisis untuk high dimentional data seperti lasso, ridge dan elastic net juga tersedia hingga pengujian hipotesisnya. Dari sisi teknik juga sudah mencakup penggunaan metode least square (LS), maximum likelihood estimator (MLE) dan bayesian. Kekurangannya untuk data spasial masih sebatas metode spasial autoregresive.
ADVERTISEMENT
Software keenam yang sering dipakai khususnya untuk big data dan machine learning adalah rapid miner. Software ini dapat diundah pada https://rapidminer.com/products/studio/. Software ini sangat kaya akan fitur visualisasi data dan analisis-analisis machine learning. Pembagian training dan testing data serta pengujian performa model terasa mudah dengan software ini.
Software Statistik Tidak Berbayar
Salah satu software tidak berbayar yang mirip dengan SPSS adalah PSPP (https://www.gnu.org/software/pspp/). Metode dalam PSPP cukup sederhana. Software tidak berbayar yang lebih kompleks adalah JASP. JASP diperkenakan oleh University of Amsterdam. Versi terbaru software ini adalah JAS 0.14 (https://jasp-stats.org/). Dalam software ini juga sudah mencakup metode estimasi bayesian. Software tidak berbayar yang setara dengan Eviews untuk analisis ekonometrik adalah Gretl. Versi terbaru software ini adalah Gretl 2021 (http://gretl.sourceforge.net/). Software ini sangat kaya alternatif model untuk data time series. Untuk data panel sama seperti Eviews masih terfokus pada model panel berbasis data normal.
ADVERTISEMENT
Software tidak berbayar dan paling powerfull saat ini adalah software R. R awalnya dibuat oleh Ross Ihaka dan Robert Gentleman dari the Department of Statistics of the University of Auckland in Auckland, New Zealand. Versi terbaru software ini adalah R 4.1.1. Analisis dalam software ini mencakup semua jenis data baik data cross section, time series maupun panel. Metode estimasi yang digunakan mencakup least square (LS), metode momen (MM), maximum likelihood estimator (mle) maupun bayesian. Data yang digunakan juga bisa mengandung data spasial. Dari sisi distribusi data dapat digunakan ada data yang berasumsi normal, keluarga eksponensial (GLM) atau tanpa syarat distribusi tertentu (misalnya regresi nonlinier dan nonparametrik). Software ini juga sangat baik untuk visualisasi data serta dapat digunakan untuk model-model machine learning. Perkembangan software R sangat cepat, karena bersifat open source dimana setiap orang dapat berkontrinbusi. Selain itu dengan menginstal berupa packages, software R cenderung lebih ringan karena kita hanya perlu menginstal packages yang kita perlukan dan dapat meg-uninstal packeges yang sudah tidak diperlukan/digunakan.
ADVERTISEMENT
Penutup
Dari pembahasan di atas, dapat kita simpulkan bahwa ada banyak jenis software statistik, baik yang berbayar maupun tidak berbayar. Setiap software memiliki kelebihan dan kekurangan masing-masing. Dengan mengetahui berbagai software tersebut, diharapkan para peneliti/penulis dapat menggunakan software sesuai keperluan penelitian yang digunakan. Jika uji dan software yang dipilih tepat maka kesimpulan dari hasil yang didapat juga tepat, sehingga dapat diimplementasikan dengan kebijakan yang tepat pula.