Analisis Diskriminan dan Aplikasinya

Pardomuan Robinson Sihombing
Seorang ASN, Fungsional Statistisi Ahli Muda, yang bekerja di Badan Pusat Statistik (BPS) Jakarta. Lulusan D-IV statistika ekonomi STIS dan S2 statistika terapan Unpad. Saat ini, melanjutkan studi doktoral statistika dan sains data di IPB University
Konten dari Pengguna
26 Agustus 2021 15:00 WIB
comment
0
sosmed-whatsapp-white
copy-link-circle
more-vertical
Tulisan dari Pardomuan Robinson Sihombing tidak mewakili pandangan dari redaksi kumparan
Ilustrasi: Statistik Survei (Sumber : https://pixabay.com/id/vectors/statistik-survei-situs-web-templat-1606951/)
zoom-in-whitePerbesar
Ilustrasi: Statistik Survei (Sumber : https://pixabay.com/id/vectors/statistik-survei-situs-web-templat-1606951/)
ADVERTISEMENT
Salah satu pemodelan dalam statistika multivariat yang digunakan untuk tujuan pengklasifikasian/ pemisahan suatu set objek/ pengamatan adalah analisis diskriminan. Tujuan analisis diskriminan adalah memodelkan hubungan antara satu variabel dependen/ respon (𝑌) yang bersifat kualitatif (kategori) dengan sejumlah 𝑝 variabel bebas 𝑋 yang bersifat kuantitatif. Adapun manfaat dari analisis ini adalah dapat menjelaskan perbedaan antar kategori (kelompok). Hal ini berdasarkan koefisien dari model diskriminan yang terbentuk. Selain itu dapat mengelompokkan suatu objek baru berdasarkan variabel bebas yang dimiliki menggunakan model diskriminan. Contoh analisis diskriminan dalam dunia pendidikan, jika peneliti ingin memprediksi penerimaan ke program pendidikan tertentu berdasarkan perbedaan mereka dalam beberapa variabel. Contoh lain dalam bidang ekonomi, seorang peneliti ingin melihat variabel sosial ekonomi apa saja yang membedakan provinsi di Indonesia bagian barat, tengah dan timur
ADVERTISEMENT
Perbedaan Analisis Diskrimian, Anova dan Logistik
Pada analisis diskriminan, variabel kategori diterapkan sebagai variabel dependen, sementara variabel kuantitatif sebagai variabel independen. Sedangkan pada ANOVA, variabel kategori diterapkan sebagai variabel independen, sementara variabel kuantitatif sebagai variabel dependen. Pada analisis diskriminan maupun regresi logistik (baik biner atau multinomial), variabel kategori diterapkan sebagai variabel dependen, hanya saja pada diskriminan independen hanya boleh variabel kuantitatif dan berdistribusi normal, sedangkan ada regresi logistik variabel independen dapat berupa data kualitatif maupun data kuantitatif sehingga tidak harus distribusi normal. Selain itu tujuan utama analsisis diskriminan adalah mencari variabel pembeda antar kategori variabel respon, sehingga regresi logistik mencari besarnya pengaruh/ peluang variabel independennya.
Asumsi Analisis Diskriminan
ADVERTISEMENT
Dalam analisis diskriminan beberapa asumsi yang mendasarinya yaitu:
1. antar objek atau pengamatan harus saling bebas
2. Variabel-variabel penjelas harus memiliki distribusi normal multivariat. Metode pengecekan kenormalatan dapat menggunakan grafik (Q-Q Plot) atau pengujian hipotesis (Uji Mshapiro maupun Doornik-Hansen )
3. Pemeriksaan asumsi homogenitas matriks variansi, diharapkan matriks kovarians antar kelompok homogen khususnya untuk fungsi diskriminan linier. Pengecekan dapat dilakukan dengan Box M maupun uji adjusted LR chi square
4. Pengujian vektor rata-rata antar kelompok berbeda. Metode pengecekan dapat menggunakan T Hotelling
Fungsi/ Model Analisis Diskriminan
Fungsi diskriminan dapat berbentuk linier mauun kuadratik. Analisis diskriminan linier (linear discriminant analysis/ LDA) merupakan generalisasi dari diskriminan linier Fisher, dimana garis pemisah antar kelompok berbentuk linier/ garis lurus. Sedangkan fungsi diskriminan kuadratik berbentuk kuadratik yang tidak mengasumsikan homogenitas matriks varians-kovarians. Selain itu terdapat metode analis diskriminan berganda (multiple discriminant analysis/ MDA). Metode ini bertujuan untuk mengurangi perbedaan/ variasi di antara variabel-variabel untuk tujuan mengklasifikasikannya ke dalam sejumlah kelompok luas tertentu sehingga akan mengurangi terjadi overfititing dalam pengklasifikasian. Lanjutan dari metode MDA, jika teknik pengurangan variasi antar variabel yang digunakan adalah analaisis komponen utama dan korelasi kanonik maka dikenal analisis siskriminan kanonik (canonic discriminant analysis/ CDA)
ADVERTISEMENT
Langkah-langkah Analisis Diskriminan
Jika kategori yang digunakan hanya ada dua kategori maka alur menyelesaikannya adalah:
a. Nyatakan matriks data sebagai 𝑿 dan variabel 𝒀 secara terurut
b. Lalu menghitung rata-rata setiap variabel untuk setiap kelompok
c. Membentuk matriks kovariansi gabungan
d. Membentuk Kombinasi Linear Fisher
e. Menghitung skor diskriminan
f. Menghitung cutting skor
g. Penghitung hit ratio/ nilai akurasi pengklasifikasian model
Jika kategori yang digunakan lebih dari dua kategori maka alur menyelesaikannya adalah:
a. Nyatakan matriks data sebagai 𝑿 dan variabel 𝒀 secara terurut
b. Hitung matriks between H
c. Hitung mariks within 𝐄, lau menghitung inversnya (𝐄^−𝟏)
d. Hitung nilai dan vektor eigen dari 𝐄^−𝟏*𝐇, lalu menghitung proporsi nilai eigen
ADVERTISEMENT
e. Menghitung skor diskriminan
f. Menghitung cutting skor
g. Penghitung hit ratio/ nilai akurasi pengklasifikasian model
Penutup
Dari pembahasan di atas, dapat kita simpulkan bahwa ada beberapa jenis metode dalam analisis diskriminan. Dengan mengetahui berbagai kriteria dan asumsi yang digunakan dalam analisis diskriminan, diharapkan para peneliti/ penulis dapat menggunakan metode analisis diskriminan yang tepat sesuai dengan kondisi data yang dimiliki. Jika uji yang dipilih tepat maka kesimpulan dari hasil yang didapat juga tepat.