Oleh: Noratiqah Mohd Ariff, PhD dan Mohd Aftar Abu Bakar, PhD
Jabatan Sains Matematik, Fakulti Sains dan Teknologi, UKM
Terdapat satu kartun animasi Jepun yang pernah saya tonton menceritakan hidup dunia masa hadapan yang mana kita boleh melarikan diri ke dalam dunia permainan buat seketika. Di dalam dunia permainan tersebut kita boleh bergerak seperti biasa, mempunyai siang dan malam, dan kita boleh berinteraksi sesama pemain secara fizikal. Secara amnya, ia seperti suatu dunia lain di alam fantasi. Watak utama kartun adalah salah seorang pereka dunia permainan tersebut. Pada suatu hari, kawan beliau bertanya, “Jika manusia boleh beroperasi seperti biasa di dalam dunia permainan dan meluangkan masa lebih lama dalam dunia tersebut, masihkah kita boleh mengatakan dunia sedia ada ini adalah dunia sebenar kita? Apakah perbezaannya dunia permainan yang direka dengan dunia sedia ada ini?” Sebelum menerangkan dengan lebih lanjut, watak utama kartun hanya menjawab dengan satu perkataan, “Data.”
Di zaman Sains Data ini, kita sering dengar atau baca kenyataan seperti “Data berada di sekeliling kita”, tetapi pernahkah kita cuba berhenti dan menghayati kenyataan ini dengan mendalam? Sebagai contoh, setiap hari kita perlu makan. Terdapat banyak pemboleh ubah berkisar dengan aktiviti pemakanan harian kita seperti masa makan, jenis makanan, kuantiti makanan dan kekerapan makan. Makanan pula ada pelbagai rasa seperti masam, masin, manis, pahit dan sebagainya. Katakanlah kita pilih makanan yang manis dan durian secara amnya merupakan suatu buah yang manis. Namun, jika ditanya kepada pemakan tegar durian, kenyataan ini kurang betul kerana terdapat durian yang mempunyai campuran manis dan pahit. Rasa durian ini pula bergantung kepada jenisnya seperti durian Musang King, D24 atau durian kampung. Durian kampung pula berbeza mengikut negerinya. Semakin lama kita fikir, semakin banyak pemboleh ubah yang boleh kita kenalpasti. Begitulah kompleksnya dan banyaknya data di sekeliling kita yang membentuk keindahan alam ciptaan Tuhan ini. Oleh itu, untuk mencipta suatu dunia seakan dunia ini, bayangkan berapa banyak data yang perlu kita analisis, kaji dan modelkan.
PENGVISUALAN DATA
Analisis dan kajian ke atas data-data yang banyak di sekeliling kita boleh membantu dalam membuat keputusan sama ada dalam kehidupan harian, pekerjaan, pengurusan perniagaan dan sebagainya. Pengvisualan data merupakan satu kaedah yang membantu menonjolkan maklumat penting daripada data melalui perwakilan grafik. Ia merupakan suatu seni yang mana maklumat dan angka dapat diserlahkan agar lebih mudah difahami. Oleh itu, ia membolehkan kita menangkap konsep yang sukar dan mengenalpasti corak baru dalam data yang diperoleh. Ciri-ciri pengvisualan yang berkesan adalah apabila grafik atau carta yang dihasilkan dapat menarik minat pembaca dan memberikan maklumat yang intuitif dengan kadar yang laju.
Sebagai contoh, cuba anda kirakan berapakah bilangan nombor ‘3’ dalam Bulatan A? Sekarang, semua nombor ‘3’ dalam bulatan tersebut diwarnakan dengan warna merah membentuk Bulatan B. Cuba anda kirakan berapakah bilangan nombor ‘3’ dalam Bulatan B? Dengan hanya menukar warna kepada perkara yang ingin diketengahkan, pengvisualan data yang lebih berkesan bagi nombor bulat dalam bulatan ini terhasil.
PENCERITAAN DATA
Tujuan utama pengvisualan data adalah untuk memaksimumkan kelajuan dan kejituan pembaca untuk mendapatkan maklumat daripada grafik yang dihasilkan. Namun begitu, dengan hanya pengvisualan, ia tidak membantu dari aspek pemahaman yang menyeluruh, keterlibatan, diingati dan hubungan emosi. Bagi meningkatkan penghayatan terhadap maklumat yang terkandung dalam data, pengvisualan data perlu digabungkan dengan penceritaan yang bermakna. Dengan itu, wujudlah konsep penceritaan data.
Suatu cerita tanpa pengvisualan data selalunya berbentuk naratif. Sebagai contoh, tahukah anda Daerah Soho di Bandar London pernah dilanda wabak taun yang sangat teruk pada tahun 1854? Kematian pada masa itu mencecah 616 orang. Pada ketika itu, Daerah Soho belum mempunyai sistem pembentungan yang baik. Oleh itu, sisa buangan hasil ladangan, perumahan dan pelbagai bahan pencemar yang lain melebihi had sistem pembentungan primitif yang sedang digunakan. Maka, kerajaan London membuat keputusan untuk membuang lebihan sisa buangan tersebut ke dalam Sungai Thames yang kemudian menyebabkan pencemaran sumber air.
Pengvisualan data tanpa penceritaan pula memberikan kita maklumat berdasarkan data tanpa pencerahan yang mendalam. Sebagai contoh, rajah di bawah menunjukkan peta yang dilukis oleh seorang doktor bernama John Snow yang kemudian dikenali sebagai salah seorang tokoh pengvisualan data. Beliau memetakan bilangan kematian akibat taun di London pada tahun 1854 berdasarkan lokasi kematian. Daripada rajah tersebut, kita dapat lihat bahawa banyak kematian berlaku di sekitar Broad Street dan kes kematian berlaku di hampir semua persimpangan jalan. Namun begitu, tanpa sebarang penceritaan sudah pasti anda kurang menghayati gambar ilustrasi yang ditunjukkan. Anda mungkin juga tidak sedar peranan pam yang agak penting dalam rajah ini.
Gabungan pengvisualan data dan penceritaan dapat meningkatkan lagi nilai suatu pengvisualan data. Sebagai contoh, rajah yang dihasilkan oleh John Snow sebelum ini. Dengan pemahaman bahawa penyebaran wabak taun adalah disebabkan oleh pencemaran pada Sungai Thames, beliau memfokuskan kajian kepada kawasan-kawasan yang menggunakan air yang disalurkan oleh dua syarikat air yang menggunakan Sungai Thames sebagai sumbernya. Beliau turut berjumpa dengan penduduk tempatan dan beliau akhirnya dapat mengenalpasti bahawa punca wabak taun ialah pam air awam di kawasan tersebut. John Snow kemudian melukiskan rajah kematian berdasarkan alamat seperti yang dilihat di atas. Beliau dapat membuktikan bahawa bilangan kematian terbanyak berada di Broad Street dengan berpusatkan suatu pam air. Dengan bantuan rajah ini, beliau berjaya meyakinkan pihak berkuasa untuk menghentikan penggunaan pam air tersebut dan sekaligus membantu menurunkan kes taun di kawasan tersebut. Berdasarkan penceritaan data ini, anda bukan sahaja dapat menghargai jasa John Snow dalam menangani epidemik taun di London pada tahun 1854 tetapi anda juga dapat menghargai kepentingan pengvisualan data yang berkesan dalam sejarah dunia.
Penceritaan data dapat merangsang pembaca dan pendengar secara mental dan emosi. Namun, penceritaan data yang baik bukanlah sesuatu yang mudah, ia memerlukan campuran bakat sains untuk menganalisis data agar maklumat yang berguna boleh diperoleh dan bakat seni untuk menghasilkan visual yang cantik serta cerita yang menarik. Sebagaimana sebarang jalinan ukhwah antara manusia, walaupun sukar tetapi hubungan yang berjaya sudah pasti dapat melahirkan hasil yang bermakna.
Rujukan:
- Laman Web OpenMind BBVA, “John Snow and the Origin of a New Medicine in the Time of Cholera”: https://www.bbvaopenmind.com/en/science/leading-figures/john-snow-the-origin-new-medicine-time-of-cholera/ (Diambil pada 1 Ogos 2022).
- Laman Web Wikipedia, “1854 Broad Street cholera outbreak”: https://en.wikipedia.org/wiki/1854_Broad_Street_cholera_outbreak (Diambil pada 1 Ogos 2022).
Penulis:
Noratiqah Mohd Ariff dan Mohd Aftar Abu Bakar merupakan pensyarah di Jabatan Sains Matematik, Fakulti Sains dan Teknologi, UKM. Kedua-duanya adalah pensyarah dalam bidang Statistik dan Analitik Data. Kedua-dua penulis boleh dihubungi melalui emel masing-masing di tqah@ukm.edu.my dan aftar@ukm.edu.my.