Oleh : Prof. Madya. Dr. Mohd Bakri Bin Adam
Jabatan Matematik, Universiti Putra Malaysia
Statistik adalah satu bidang yang berkaitan dengan pengumpulan, pengurusan, analisis, tafsiran dan mendapatkan maklumat yang terkandung di dalam suatu set data. Statistik merupakan satu bidang yang melibatkan pengekstrakan maklumat daripada data terutamanya yang berbentuk angka atau bilangan tetapi tidak terhad kepada kedua jenis tersebut tetapi bentuk data yang lain adalah perkataan, nilai serta data kualitatif. Kebiasaannya aktiviti mendapatkan maklumat di atas berjaya dilakukan dengan berkesan dengan bantuan seseorang yang bergelar ahli statistik.
Siapakah ahli statistik? Apakah kelayakan yang perlu ada sebelum menjadi ahli statistik? Bagi menjawab pertanyaan ini, penulis akan memperincikan keperluan yang diperlukan untuk menjadi seorang ahli statistik. Kebanyakan semua bidang seperti pertanian, perhutanan, pengurusan, perubatan, ekonomi, sains sosial, bahasa, kejuruteraan, alam sekitar, pendidikan, komputer, bioteknologi dan banyak lagi memerlukan statistik samada untuk analisis ringkas data sehinggalah kepada bentuk yang lebih kompleks.
Kalau diteliti kembali kepada subjek yang perlu diambil oleh mahasiswa di kebanyakan universiti, kebanyakan program pengajian akan mewajibkan subjek pengenalan statistik diambil. Bagi menjadi seorang ahli statistik sebenarnya, permulaan yang baik adalah bermula dengan ijazah muda dalam pengkhususan statistik, yang mana kebiasaannya pada tahun pertama dan kedua banyak subjek matematik berkaitan dengan kalkulus dan aljabar serta pengaturcaraan pengkomputeran perlu diambil. Subjek statistik yang diterapkan adalah berkait dengan teori kebarangkalian, regresi, pemodelan statistik, penggunaan beberapa pakej statistik, siri masa, analisis kemandirian, statistik multivariat, statistik komputasi, statistik tak-berparameter, bayes, analisis terokaan data dan beberapa subjek statistik yang lain. Kebiasaannya sekarang ini pelajar statistik perlu membuat projek penyelidikan selama satu tahun dan pada tahun terakhir menjalani latihan praktikal di industri yang terpilih selama satu semester bagi mempraktikkan segala pengetahuan statistik yang diperoleh pada semester sebelumnya.
Untuk menambahkan ilmu dalam bidang statistik, disyorkan pelajar yang sudah mempunyai ijazah muda dalam statistik tadi melanjutkan pengajian di peringkat sarjana secara kerja kursus untuk menambahkan lagi pengetahuan kerana subjek yang diajar adalah tambahan kepada tahap kedalaman kepada pengetahuan statistik yang sedia ada. Subjek seperti regresi yang lebih kompleks, teori nilai ekstrim, statistik teguh, siri masa lanjutan, ekonometrik akan diperkenalkan. Sekiranya pengajian peringkat ini berjaya diperolehi baharulah seseorang itu layak untuk menjadi perunding statistik. Namun ada yang tidak memilih kerja kursus pada peringkat master tetapi memilih untuk terus membuat master secara penyelidikan sepenuh masa. Ini bermakna graduan master penyelidikan sepenuh masa ini akan lebih fokus dan lebih tertumpu penyelidikan kepada satu bidang khusus dalam statistik. Kemudian graduan kedua lulusan master di atas berkemungkinan berpeluang melanjutkan pengajian yang tertinggi iaitu membuat pengajian di peringkat doktor falsafah dalam bidang statistik. Pengajian doktor falsafah ini adalah lebih berfokus tetapi mereka dilatih untuk membuat satu penyelidikan yang bermula dengan sorotan literatur, kajian metod, pelaporan hasil yang semua itu akan digabungkan dalam satu manuskrip yang bergelar tesis. Tesis yang ditulis perlu diuji secara lisan dalam majlis yang digelar acara viva-voce. Sekiranya mereka berjaya pertahankan tesis yang ditulis dalam viva-voce tadi, mereka akan dikurniakan kelayakan akademik tertinggi iaitu PhD dalam statistik yang membolehkan mereka membawa gelaran Dr atau Doktor di hadapan nama mereka selama-lamanya.
Sebenarnya seseorang yang ahli dalam bidang statistik boleh dikategorikan kepada tiga kumpulan. Pertama adalah dalam bidang statistik, kedua ialah bidang statistik gunaan dan terakhir adalah statistik sosial. Kumpulan pertama adalah graduan yang memperoleh ijazah sarjana muda, ijazah sarjana dan ijazah kedoktoran kesemuanya adalah dalam berkaitan dengan bidang statistik. Manakala kumpulan bidang statistik gunaan pula adalah mereka yang lazimnya hanya mempunyai kemahiran dalam mengaplikasikan ilmu statistik dengan data yang terhad, pengajian sarjana muda dan sarjana kebiasaan bukan statistik tetapi kebiasaan adalah dalam bidang sains. Manakala statistik sosial pula kumpulan yang menggunakan statistik untuk analisis data sosial dan antara yang popular ialah pemodelan persamaan berstruktur, kebiasaannya mereka menggunakan pakej statistik sedia ada.
Pada masa ini, untuk menjadi seorang ahli statistik yang berkaliber, terdapat tiga skil yang perlu ada. Pertama ialah seseorang ahli statistik itu mampu membina metod statistik yang baharu sekira diperlukan. Untuk membina metod statistik yang baru, kebiasaan kemahiran dalam teoritikal matematik amat diperlukan, tetapi golongan ini mula berkurangan secara drastik, antara sebabnya adalah asas matematik yang lemah dan hasilan penerbitan yang mengambil masa yang agak lama serta artikel yang dihasilkan tidak dirujuk oleh ramai penyelidik lain. Skil yang kedua ialah seseorang ahli statistik perlu mahir dalam bahasa pengaturcaraan berkomputer samada dalam bahasa C atau C++, bahasa Fotran, Python, R atau sebagainya, kerana banyak pemodelan dalam statistik tidak dapat diselesaikan secara langsung secara bermatematik seperti model yang melibatkan kamiran dan hanya dapat diselesaikan secara berangka. Kadang-kadang penyelesaian memerlukan pengiraan aljabar yang kompleks atau melibatkan penggunaan data raya bagi pengiraan nilai-nilai statistik seperti purata, nilai penengah, nilai mod, varian dan sebagainya. Skil terakhir yang perlu ada pada seorang ahli statistik ialah tahu mengaplikasikan setiap metod statistik samada yang baharu atau yang sedia ada bergantung kepada kepelbagaian dan ciri data.
Semenjak akhir-akhir ini ramai yang mendakwa mereka berpengetahuan dalam bidang statistik tetapi setelah diteliti banyak kesalahan telah dilakukan ketika mereka menggunakan alatan statistik. Mereka secara semberono telah menggunakan alatan statistik tanpa memastikan andaian yang betul telah dipenuhi. Sebagai contoh kesalahan yang ketara ialah penggunaan model regresi, penyemakan model yang diperoleh tidak memenuhi andaian-andaian yang sepatutnya. Manakala berlaku salah faham tentang jenis pemboleh ubah yang terlibat, sebagai contoh data yang berbentuk masa yang telah dikelirukan samada ianya adalah selanjar ataupun diskrit. Nilai mata wang juga mengalami kekeliruan pengkelasan. Ahli statistik sebenar akan dapat mengesan kesalahan yang dilakukan dengan senang, lebih lagi ramai di luar sana yang lebih mempercayai hasilan perisian statistik yang dikeluarkan adalah tepat dan benar. Sehingga kata-kata yang lahir seperti sekian perisian memberikan saya ini dan ini tanpa menyedari bahawa ianya adalah salah. Perisian ini boleh menerima sebarang data dan memberikan jawapan walaupun kurang tepat.
Ada juga yang telah berjaya memperoleh PhD dalam bidang yang seakan-akan dalam bidang statistik tetapi ijazah sarjana muda dan master bukan dalam bidang statistik yang menyebabkan berlaku kelompongan ilmu asas statistik. Mereka mendakwa mereka pakar dalam statistik tetapi pada hakikatnya mereka sebenarnya tidak mempunyai skil yang mencukupi terutama dalam membina kaedah yang baharu dalam statistik. Persoalan yang mudah seperti sekiranya ujian x tidak boleh digunakan adakah mereka mampu membina dan mencadang satu ujian lain yang lebih bersesuaian?
Graduan statistik berada di mana-mana terutamanya sekiranya keperluan menganalisa data diperlukan. Antara kerjaya seorang graduan berlatar belakang statistik adalah juruanalisa data yang mungkin dilantik sebagai saintis data atau seorang guru, juga mungkin sebagai pensyarah universiti. Ahli statistik kebanyakan akan tahu tentang asas statistik terutamanya berkaitan dengan bidang statistik gunaan, tetapi mula mengkhusus kepada bidang yang yang lebih berfokus ketika belajar di peringkat PhD. Sub-bidang yang luas menyebabkan tidak semua ahli statistik tahu semua cabang bidang statistik, inikan pula graduan yang tidak mengambil major statistik. Kebanyakan persidangan matematik meletakkan statistik sebagai satu bidang sahaja, tetapi pada masa yang sama menyenaraikan semua sub-bidang matematik, kekeliruan ini timbul kerana kurang peka penganjur terhadap perkembangan bidang statistik yang sudah lama berpisah secara jelas daripada matematik.
Dilema yang dihadapi oleh pensyarah statistik adalah kebanyakan hasil kajian mereka setelah beberapa lama diketengahkan ke dalam masyarakat, ianya sudah tidak lagi dirujuk oleh penyelidik lain kerana ianya sudah cukup terkenal ataupun sudah menjadi norma dalam kalangan ahli akademik. Kadang-kadang mengambil bertahun untuk dikenali. Ada juga alatan statistik yang bertahan beratus tahun. Antara contoh yang boleh diberikan adalah penggunaan plot kotak yang diperkenalkan oleh Profesor Tukey pada tahun 1977. Yang sekarang ini, kebanyakan pengguna plot kotak sudah tidak lagi merujuk kepada Profesor Tukey ketika menggunakannya dalam artikel masing-masing. Contoh lain adalah penggunaan ujian-t, ujian ANOVA dan lain lain yang mana pengasasnya sudah dilupakan. Pengiraan purata, penengah dan mod sudah tidak diketetahui siapakah pengasasnya. Histogram pula sudah ratusan tahun penggunaannya.
Antara cabaran besar ahli statistik adalah bila bidang sains data semakin popular tambahan pula dengan kewujudan data raya yang banyak. Salah satu elemen penting dalam data sains adalah analisis data yang memerlukan pengetahuan statistik. Cabaran yang dihadapi oleh ahli statistik masa kini adalah mereka perlu memperkenalkan teknik analisis termasuk kaedah perihalan yang baru, pengujian parameter, penmodelan data raya dan banyak lagi alatan statistik yang perlu rombakan untuk disesuai dengan keadaan semasa data. Data yang pelbagai bentuk, ditambah pula kes data yang terhilang, mahupun kewujudan data terpencil yang tidak memungkinkan penggunaan alatan statistik sedia ada bagi mendapatkan maklumat daripada data.
Selain daripada itu, ahli statistik perlu berupaya mempermudahkan hasilan maklumat dan keputusan yang diperoleh daripada analisis statistik yang dijalankan agar ianya berguna kepada masyarakat. Ini suatu kerja yang sukar kerana masyarakat masih tidak dapat membezakan antara bidang statistik dan matematik. Masyarakat secara amnya masih menganggap statistik suatu yang sukar dipelajari. Tambahan pula subjek berkaitan dengan statistik baharu sahaja diperkenalkan dalam silibus di peringkat sekolah rendah dan menengah yang dibuat daripada sudut pandang seorang matematik bukan ahli statistik kerana graduan awal sarjana muda statistik di Malaysia masih baharu lagi iaitu di sekitar pertengahan 90an. Universiti yang menawarkan major statistik yang diajar oleh pensyarah yang mempunyai kelayakan PhD dalam statistik masih kurang, diperhatikan sekiranya subjek statistik sepatutnya diajar oleh orang yang berlatarbelakangkan matematik sekalipun, konsep statistik yang betul tidak dapat disampaikan dan diajarkan dengan sempurna. Dari segi penyelidikan asas statistik, penghasilan metod baru dalam statistik berdepan dengan banyak cabaran terutamanya dari segi penerbitan kerana pembuktian matematik yang wujud, memerlukan masa yang agak lama daripada pihak jurnal kerana proses pewasitan yang ketat. Kebanyakan ahli statistik ada juga yang menerbitkan hasil kajian yang lebih kepada statistik gunaan kerana mereka boleh menggunakan teknik statistik sedia ada bagi mendapatkan hasil maklumat daripada data yang dikaji, serta lebih banyak ruang penerbitan untuk diterima. Sebagai contoh dalam bidang statistik perubatan, dengan kaedah statistik sedia ada tetapi cabaran adalah lebih kepada mendapatkan data perubatan kerana melibatkan pesakit atau terdapat etika yang perlu dipatuhi.
Kebiasaan graduan statistik akan dilengkapkan dengan kemahiran dalam penggunaan beberapa perisian statistik seperti SAS, SPLUS, Minitab, STATA, R dan sebagainya. Kemahiran ini perlu pada peringkat rundingcara dengan pihak industri dan pihak ketiga yang memerlukan penganalisaan data untuk mendapatkan sokongan saintifik kepada analisis yang dijalankan. Manakala sesiapa yang menceburi bidang sosial sains pula, kemahiran berkaitan sosial statistik, perisian seperti Excel dan SPSS amat diperlukan.
Kerjaya sebagai ahli statistik adalah unik dan juga mungkin sukar dalam masa yang sama terutama yang bekerja dalam bidang akademik dan industri. Ramai yang beralih kerjaya sebagai seorang saintis data bukan ahli statistik kerana kepopularannya. Ini juga berlaku akibat kesedaran tentang kewujudan data yang pelbagai bentuk termasuk data raya yang perlu diurus, disusun dan diekstrak bagi mendapatkan maklumat berguna. Tambahan pula dengan kewujudan slogan yang data adalah maklumat, serta data adalah kuasa. Sesiapa yang mempunyai data, mereka adalah lebih berkuasa. Berpaksikan pengetahuan statistik dan kebolehan dalam pengaturcaraan komputasi, mereka mampu menjadi saintis data yang lebih hebat.
Cabaran kerjaya sebagai ahli statistik telah bermula semenjak bidang statistik mula dikenali berbeza daripada subjek matematik, ekonomi dan kewangan. Keterlihatan banyak subjek statistik yang timbul, memberikan petanda bahawa statistik merupakan suatu bidang yang penting dan ianya digunakan oleh banyak bidang lain. Tambahan pula kebanyakan alatan statistik adalah dibina dan dicipta berdasarkan fakta dan bersaintifik. Seorang ahli statistik bukan seorang penipu, juga bukan seorang ahli nujum meramal masa depan tetapi penghubung penting di antara dua entiti iaitu data dan maklumat. Peranan ahli statistik pasti akan sentiasa didambakan setiap detik dan sepanjang zaman.
Penulisan di atas adalah hasil dari pemerhatian penulis setelah berkecimpung lebih kurang 25 tahun dalam bidang statistik.
Biodata penulis:
- Memperoleh Bacelor dwi major matematik dan statistik pada tahun 1995 dan juga lulusan Master Sains (Statistik Gunaan). Melanjutkan pelajaran ke peringkat PhD dalam bidang statistik. Sekarang adalah seorang pensyarah kanan statistik di sebuah universiti awam di Malaysia.
Kredit Foto :
Photo by Ruthson Zimmerman on Unsplash
Photo by Taras Shypka on Unsplash
minitab