Penulis: Prof. Madya Dr. Nurulkamal Masseran
Pensyarah Kanan
Jabatan Sains Matematik, Universiti Kebangsaan Malaysia
Taburan Normal atau juga dikenali sebagai taburan Gaussan (Gaussian distribution) merupakan model statistik yang tidak asing dalam pelbagai bidang ilmu sama ada sains tulen, sains gunaan, kejuruteraan, sains perubatan, ekonomi, kewangan, mahupun sains sosial. Taburan Normal mula ditemui oleh ahli matematik Perancis iaitu Abraham De Moivre pada sekitar kurun ke-17 yang pada asalnya beliau mengkaji masalah berkaitan permainan judi. Secara ringkasnya, penemuan beliau mendapati kebarangkalian pemboleh ubah binomial untuk bilangan percubaan yang besar adalah menghampiri bentuk lengkung loceng yang simetri (symmetry bell curve). Seterusnya, Pierre-Simon Laplace yang juga ahli matematik Perancis telah menghuraikan dengan lebih terperinci berkenaan sifat asas taburan Normal terutama berkaitan pembuktian Teorem Had Memusat (Central Limit Theorem). Teorem Had Memusat ini telah menjadi salah satu teorem terpenting dalam bidang statistik pada masa kini. Manakala, penggunaan meluas taburan Normal mula dipopularkan oleh ahli matematik Jerman iaitu Carl Gauss sekitar awal kurun ke-18. Gauss berpendapat bahawa sifat ralat ukuran adalah mengikuti corak yang khusus, di mana ralat yang bernilai kecil adalah biasa berlaku, manakala ralat bernilai besar adalah jarang berlaku, dan juga ralat bernilai positif atau negatif masing-masing mempunyai kemungkinan sama untuk berlaku. Corak sebegini adalah sepadan dengan tingkahlaku yang boleh diungkap menerusi taburan Normal. Andaian ini menjadikan taburan Normal banyak digunakan dalam pembangunan pelbagai ujian-ujian dan model-model statistik. Sekaligus menjadikan taburan Normal lebih dikenali sebagai taburan Gaussan pada masa kini.
Apakah itu taburan Normal?
Secara spesifiknya, taburan Normal ialah model matematik/statistik yang menghuraikan variasi taburan data mengikut corak lengkung loceng yang simetri. Iaitu, bentuk lengkung loceng simetri ini menggambarkan bahawa majoriti data adalah terkumpul di sekitar nilai purata data (parameter min), minoriti kecil data mempunyai sifat yang agak berbeza yang kedudukannya terletak sedikit jauh berbanding parameter min, dan nilai-nilai ekstrem yang sangat jauh dari min adalah senario yang sangat jarang berlaku. Seberapa besar variasi dalam corak lengkung loceng yang simetri ini diungkap oleh ukuran serakan menerusi parameter sisihan piawai.

Secara teorinya, bagi taburan Normal dengan bentuk loceng yang “sempurna”, 68% dari keseluruhan taburan data akan berada pada julat satu sisihan piawai min, 95% dari keseluruhan taburan data akan berada pada julat dua sisihan piawai min, dan 99.7% dari keseluruhan taburan data akan berada pada julat tiga sisihan piawai min. Petua mudah ini menjadikan taburan Normal sangat mudah digunakan untuk kita memahami ketidakpastian dan variasi dalam kebanyakan fenomena dunia nyata. Ianya menerangkan bahawa kebanyakan peristiwa yang berlaku adalah berkisar dalam norma tertentu dan hanya sekali sekala akan wujud peristiwa yang bersifat ekstrem dan menyimpang dari norma.
Fenomena dunia nyata yang boleh dikaitkan dengan taburan Normal
Antara alasan mengapa taburan Normal mendapat tempat dalam pelbagai bidang ilmu ialah kerana ianya seringkali boleh dikaitkan dengan sifat semulajadi fenomena alam dan juga dalam pelbagai aktiviti seharian manusia. Senario ini berlaku kerana apabila banyak cerapan-cerapan yang saling tak bersandar digabungkan secara bersama, ianya akan cenderung membentuk corak lengkung simetri berbentuk loceng. Tingkah-laku data sebegini berjaya diterangkan dengan berkesan menerusi sifat taburan Normal, sekaligus menjadikannya mudah dan sesuai digunakan untuk menerangkan variasi pelbagai data dunia sebenar. Antara contoh aplikasi taburan Normal dalam dunia sebenar ialah:
- Ciri-ciri fizikal dan biologi manusia
Kebanyakan ciri-ciri fizikal dan biologi dalam populasi yang besar umumnya mengikuti corak yang menghampiri bentuk taburan Normal. Ciri-ciri manusia seperti ketinggian dan berat badan, masa tindak balas dan kepantasan pergerakan, serta ukuran-ukuran fisiologi umumnya cenderung berkumpul di sekitar suatu nilai purata. Hanya sedikit individu yang akan memiliki ciri-ciri fizikal dan biologi yang lebih ekstrem. Sama ada ekstrem aras atas mahupun ekstrem aras bawah.
- Skor Markah
Dalam pendidikan, markah ujian selalunya akan bertingkah-laku menyerupai bentuk lengkung loceng, terutamanya dalam populasi pelajar yang ramai. Ini membolehkan pendidik menilai, membandingkan, memahami prestasi dan juga mengukur perbezaan tahap pencapaian pelajar dengan mudah. Senario ini juga membantu pendidik untuk mereka bentuk kaedah penilaian yang lebih adil dari semasa ke semasa.
- Kawalan Kualiti dan Pembuatan
Industri pembuatan moden sangat bergantung kepada proses kawalan kualiti dalam menghasilkan produk yang bermutu tinggi dan kurang bermasaalah. Kaedah popular seperti Six Sigma telah digunakan secara meluas di industri bagi tujuan meningkatkan kualiti dan keberkesanan proses organisasi. Intipati kaedah Six Sigma adalah dengan mengandaikan bahawa proses pembuatan dan penghasilan produk adalah tertabur secara taburan Normal dengan lengkung loceng simetri. Oleh itu, kualiti proses penghasilan produk secara mudah boleh dipantau dalam julat sisihan piawai yang menyimpang daripada nilai purata proses. Julat satu sehingga enam sisihan piawai menggambarkan sejauh mana tindakan perlu diambil untuk membetulkan proses atau untuk meningkatkan kualiti penghasilan produk.
- Kewangan dan Penilaian Risiko
Dalam bidang kewangan dan pengurusan risiko, kebanyakan tingkahlaku data seperti pasaran saham, kadar tukaran asing, dan mata wang kripto pada asalnya bukanlah tertabur secara Normal. Sebaliknya ianya lebih cenderung bersifat pencong ke kanan. Namun, menerusi teknik penjelmaan, tingkah-laku data sebegini seringkali akan dijelmakan kepada bentuk taburan Normal untuk memboleh analisis statistik dan penilaian risiko dapat dijalankan dengan lebih mudah dan berkesan.
Kesemua aplikasi dalam kehidupan sebenar ini menunjukkan bahawa taburan Normal bukanlah hanya suatu idea Matematik yang bersifat abstrak. Sebaliknya, ianya merupakan alat yang menghubungkan ketidakpastian kepada pemahaman, dan juga sebagai kaedah yang praktikal untuk mentafsir data kepada keputusan.
Taburan Normal dalam Era Statistik Moden dan Sains Data
Dalam bidang ilmu statistik dan sains data, model lengkung simetri loceng yang diterjemah menerusi taburan Normal bukanlah hanya semata-mata alat atau kaedah untuk menganalisis dan memodelkan data, namun lebih dari itu, ianya membentuk acuan cara berfikir dikalangan ahli statistik dan saintis data. Walaupun pada era data data raya kini, dengan kemunculan pelbagai algoritma yang kompleks, taburan Normal masih dianggap sebagai salah satu model yang praktikal dan masih digunakan secara meluas. Taburan Normal sering memainkan peranan sebagai andaian-andaian asas, blok-blok pembina, titik permulaan ataupun model rujukan dalam pelbagai kaedah-kaedah statistik dan sains data yang lebih terkehadapan dan kompleks. Secara khususnya, peranan taburan Normal dalam era statistik moden dan sains data pada masa kini meliputi aspek berikut:
- Prinsip Teorem Had Memusat:
Kebanyakan kaedah-kaedah dalam statistik klasik seperti pembinaan selang keyakinan, ujian hipotesis, analisis regresi, dan pelbagai model-model lain dibangunkan berdasarkan andaian kenormalan. Meskipun begitu, pada masa kini, dengan sifat kekompleksan dalam data raya yang berdimensi tinggi, sebahagian data sukar untuk dibuktikan ianya menghampiri bentuk taburan Normal. Namun, menerusi prinsip Teorem Had Memusat, walaupun data cerapan asal tidak tertabur secara Normal, parameter purata (min) bagi data tetap akan cenderung mengikut taburan Normal. Ini sekaligus menjadikan kebanyakan kaedah-kaedah dalam statistik klasik masih releven pada masa kini.
- Memahami Ketidakpastian, Risiko dan Tingkah-laku Data
Tujuan analisis data dijalankan bukanlah sekadar untuk membuat peramalan. Sebaliknya, lebih daripada itu, ianya juga bertujuan untuk memahami ketidakpastian dan tingkah-laku data. Dalam senario ini, taburan Normal masih merupakan model asas yang relevan untuk mengukur variasi dan menilai risiko. Aplikasi di industri seperti kawalan kualiti dalam pembuatan, ujikaji makmal dan juga penilaian risiko dalam kewangan masih menggunakan taburan Normal dalam pelbagai kaedah seperti carta kawalan, reka bentuk ujikaji dan teknik-teknik ekonometrik untuk memahami tingkah-laku data.
- Pembelajaran Mesin dan Teknologi Kecerdasan Buatan (AI)
Di sebalik pelbagai algoritma pembelajaran mesin yang muncul selari dengan kemajuan teknologi AI pada masa kini, andaian berkaitan ralat atau hingar menerusi taburan Normal masih merupakan salah satu pendekatan yang relevan dan praktikal. Kaedah seperti model regresi, proses Gaussan, dan sebahagian pembinaan model rangkaian neural masih bergantung kepada taburan Normal bagi tujuan memudahkan penghitungan dan meningkatkan prestasi model.
- Kaedah Penyeragaman dan Perbandingan
Kekompleksan data raya berdimensi tinggi datang bersama kerencaman pelbagai pemboleh ubah dengan unit ukuran dan magnitud yang berbeza. Dalam mengatasi kekompleksan ini, taburan Normal menjadi salah satu kaedah yang popular yang masih kerap digunakan oleh penganalisis data untuk menyeragamkan data kepada skor-z. Ini membolehkan analisis data dijalankan dengan lebih mudah dan tidak pincang.
Malah, dalam tempoh hampir mencapai tiga abad sejak taburan Normal mula-mula diperkenalkan oleh Abraham De Moivre, taburan Normal telah diguna pakai dalam banyak lagi aplikasi-aplikasi dunia nyata yang secara tidak langsung telah memacu kemajuan teknologi masa kini. Walaubagaimanapun, taburan Normal bukanlah model matematik/statistik yang sempurna yang boleh dianggap sebagai suatu hukum sejagat (universal law). Kerencaman variasi data dengan kes-kes yang khusus seperti ekor-berat (heavy-tail), hukum-kuasa (power-law), taburan mod berbilang (multiple modes distribution), taburan campuran dan komposit (mixture and composite distribution), fraktal berganda (multifractal), nilai ekstrem luar biasa: mekanisma “angsa hitam” dan “raja naga” (super extreme value: black swans and dragon king mechanisms) dan lain-lain fenomena dunia nyata yang bersifat luar biasa seringkali memerlukan “sentuhan khusus” yang tidak dapat diungkapkan menerusi taburan Normal.
Rujukan:
Date, S. (2024). Abraham De Moivre, His Famous Theorem, and the Birth of the Normal Curve. Available at: https://medium.com/data-science/abraham-de-moivre-his-famous-theorem-and-the-birth-of-the-normal-curve-ee11ab5f9f20
Date, S. (2024). Pierre-Simon Laplace, Inverse Probability, and the Central Limit Theorem. Available at: https://medium.com/data-science/pierre-simon-laplace-inverse-probability-and-the-central-limit-theorem-d52bec2e0dba
Jaynes. E. T. (2003). Probability theory: the logic of science. Cambridge University Press.
Liao, L. (2021). An introduction of Normal distribution and Carl Fredrich Gauss. Available at: https://lamar-liao.medium.com/an-introduction-of-normal-distribution-and-carl-fredrich-gauss-373385dfb159
Murphy, K. P. (2022). Probabilistic Machine Learning: An Introduction. The MIT Press.
Nesselroade, P. (2021). Abraham De Moivre and the History of the Normal Curve. Available at: https://paulnesselroade.com/textbook-excerpts/abraham-de-moivre-and-the-history-of-the-normal-curve/
Rathie, P. N., Ozelim, L. C. D. S. M., & Lovric, M. (2025). Normal Distribution: Its Properties, Importance, and Applications in Science. In International Encyclopedia of Statistical Science (pp. 1765-1772). Berlin, Heidelberg: Springer Berlin Heidelberg.
Rodriguez, D. (2025). Six Sigma Methodology for Quality Improvement Explained. Available at: https://www.invensislearning.com/blog/six-sigma-methodology/




