Oleh:
Prof. Madya Dr. Nurfadhlina Mohd Sharef
Ketua Kumpulan Penyelidikan Pengkomputeran Pintar
Fakulti Sains Komputer dan Teknologi Maklumat
Universiti Putra Malaysia
Berikut merupakan transkrip terjemahan daripada sesi wacana radio yang mengambil tempat di TraXX.FM (saluran 90.3 FM) pada 21 Februari, 2018. Wacana radio di bawah anjuran Majalah Sains untuk mewujudkan kesedaran pengguna mengenai topik analitis data raya ataupun Big Data Analytics. Analitis Data Raya merupakan istilah rasmi diperkenalkan oleh MAMPU (Sumber: Laman web MAMPU)
TraXX.FM: Berkaitan dengan topik di atas, boleh anda terangkan tentang konsep atau teori di sebalik analitis data raya?
Dr. Nurfadhlina: Data Raya (Big Data) merupakan satu ledakan informasi yang seiring dengan pertumbuhan ekosistem penggunaan peranti mudah alih dengan keupayaan pemproses yang pantas, capaian Internet berkelajuan tinggi dan kematangan teknologi simpanan data. Perkembangan fenomena Data Raya juga berkait rapat dengan penghasilan data yang pelbagai format dan jenis (variety), dalam isipadu (volume) besar dan frekuensi (velocity) tinggi. Ianya mampu mendorong pertumbuhan inovasi baru dan membuka ruang kepada industri dan agensi kerajaan bagi meningkatkan kualiti perkhidmatan, jika tidak, memperkenalkan perkhidmatan baru yang tidak pernah muncul sebelum ini.
Analitis data raya terdiri daripada proses pemeriksaan, pembersihan, perubahan, dan pemodelan data dengan matlamat untuk mencari maklumat yang berguna bagi membuat sesuatu keputusan. Di sini, analitis data raya boleh dilihat sebagai suatu ‘peralatan’ (dalam bentuk perisian) sokongan dalam menyokong di dalam sesuatu keputusan melalui maklumat yang dihasilkan. Ini kerana maklumat tersebut bertindak sebagai bukti berkenaan sesuatu perkara yang terlibat dengan keputusan yang hendak dibuat. Analitis data raya juga merupakan gabungan daripada kemahiran menggunakan teknik teknologi maklumat, seperti bahasa pengaturcaraan yang bersesuaian untuk menganalisa data dan ‘seni’ (ataupun kreativiti) dalam memahami maklumat yang terhasil; supaya ia dapat dirumuskan dan diterjemah kepada bentuk visual yang boleh membantu pengguna untuk membuat sesuatu keputusan.
Terdapat tiga jenis analisis di dalam data raya, iaitu (i) deskriptif/eksploratif, (ii) ramalan dan (iii) preskriptif. Teknik seperti pengurusan data, penerokaan data, statistik, perlombongan data dan gambaran visual merupakan komponen-komponen penting untuk teknologi analitis data. Contoh aplikasi keputusan dengan analitis data di sebuah hospital adalah pengoptimuman dan perancangan tempahan ubat dengan mengenal pasti rekod pesakit-pesakit terdahulu dan meramalkan pesakit yang akan datang. Maklumat ini amat berguna bagi pegawai di bahagian inventori hospital dan farmasi bagi menguruskan bilangan dan jenis ubat yang perlu dipesan.
TraXX.FM: Mengapakah teknologi analitis data raya penting pada masa kini?
Dr. Nurfadhlina: Manfaat terbesar daripada analitis data adalah pengurangan kos dan pengoptimuman sumber berdasarkan perancangan strategik di dalam organisasi. Bersambung daripada contoh pesanan ubat tadi; dengan mengetahui lebih awal mengenai taburan statistik keperluan ubat oleh pesakit berdasarkan umur, masa, jenis ubat dan bilangannya, ubat tersebut boleh dipesan mengikut kuantiti dan masa yang diperlukan sahaja. Ini dapat mengurangkan pembaziran ubat, menjimatkan kos penghantaran, mengelakkan pembaziran ruang simpanan, mengelakkan pembaziran masa mengira stok dan mengoptimumkan penggunaan sumber tenaga pekerja.
TraXX.FM: Adakah industri selain daripada kesihatan boleh mendapat manfaat daripada teknologi analitis data ini?
Dr. Nurfadhlina: Analitis data membenarkan organisasi menghubung dan memahami tingkah laku pelanggan mereka. Sebagai contoh, hubungkait antara maklumbalas pelanggan-pelanggan mereka melalui media sosial dengan prestasi & perbelanjaan oleh organisasi, seperti iklan di atas talian dan kempen jualan. Manfaatnya ialah organisasi boleh merancang operasi mereka secara strategik. Sebagai contoh pengetahuan dalam pembungkusan produk yang menepati selera pelanggan daripada maklumbalas media sosial dan saluran promosi media digital yang mampu meningkatkan pulangan kepada pelaburan. Keputusan dibuat oleh analitis data ini membolehkan syarikat menawarkan produk atau perkhidmatan mengikuti keperluan khusus pelanggan mereka. Lantas menjimatkan perbelanjaan yang tidak perlu, meningkatkan jualan dan meningkatkan penembusan pasaran.
Analitis data juga sesuai untuk industri berasaskan perniagaan dan perkhidmatan. Sebagai contoh, dengan mengetahui tahap genting ancaman serangan siber terhadap sesuatu aset dalam organisasi dan seterusnya meramalkan corak serangan siber daripada analitik data, pegawai keselamatan rangkaian boleh melakukan mekanisma pencegahan yang sesuai untuk mengelakkan berlakunya eksploitasi daripada luar rangkaian.
Satu lagi contoh yang dapat saya kongsikan adalah manfaat analitis data kepada rakyat. Bayangkan sekiranya corak penggunaan pengangkutan awam di kalangan penduduk di Lembah Klang dapat difahami. Ini boleh dilakukan dengan melihat rekod penggunaan kad TouchNGo di kesemua stesen pengangkutan awam yang dilalui oleh pengguna tersebut. Dengan menganalisa rekod ini, organisasi dapat memahami corak penggunaan stesen dan juga jenis pengangkutan mengikut keutamaan pelanggan. Tambahan pula, profil keutamaan ini dapat dianalisa mengikut umur, jantina dan jenis kaum pelanggan. Dengan maklumat ini, proses perancangan kadar sewaan kepada pembekal dan pekedai yang ingin membuka kedai di stesen tersebut dapat dilakukan berdasarkan kepada nisbah kutipan yang bakal kedai tersebut perolehi. Maklumat ini juga boleh digunakan oleh pekedai yang ingin mencari tapak perniagaan yang sesuai dan dapat melakukan ramalan kutipan mereka. Ini sudah tentu dapat meningkat ekonomi setempat dan memberi keselesaan kepada rakyat kerana keperluan mereka tersedia dan dapat diperolehi dengan mudah. Sebenarnya banyak negara lain telah mula mengambil manfaat daripada penganalisaan data daripada contoh penggunaan stesen ini bagi merancang penjanaan pendapatan tuan milik stesen.
Urusan harian juga boleh mendapat manfaat daripada analitis data. Bayangkan sebuah apps yang bertindak sebagai pengurus peribadi kita kerana berupaya menganalisis corak perbelanjaan dan rekod barangan yang selalu kita beli. Alangkah bagus jika apps ini boleh mencadangkan strategi penjimatan dan mengingatkan kita apabila kita perlu menambah stok barangan di rumah. Bukankah ini memudahkan hidup harian kita? Apps ini boleh dilihat sebagai seorang pengurus peribadi yang prihatin tentang diri dan wang saku anda. Paling penting sekali, pengurus peribadi ini sangat bijak pada kos yang jauh begitu murah!
Perasaan ralat tidak akan timbul apabila kita menyedari ramuan yang diperlukan untuk masak, namun sudah habis di dalam simpanan. Seterusnya, bayangkan pula jika ‘pengurus’ (apps) berkenaan boleh mengingatkan kita akan risiko jatuh sakit jika tidak mengambil sesuatu pemakanan. Bagaimana pula pengurus ini boleh mengetahui semua maklumat ini? Mudah sahaja! Ini dengan menghubungkait rekod pemakanan harian kita dengan rekod lawatan ke pusat kesihatan dan pengambilan ubat yang dihuraikan terlebih dahulu.
TraXX.FM: Bagaimana pula caranya bagi menggunakan teknologi analitik data untuk mengurangkan kes penceraian? Statistik daripada Jabatan Kehakiman Syariah Malaysia menunjukkan sejumlah 171,252 kes perceraian direkodkan dari 2014 hingga Julai 2016. Daripada jumlah tersebut, 30% kes perceraian dicatatkan pada tahun 2014, manakala 2015 menyaksikan kenaikan 2% dalam kes penceraian.
Dr. Nurfadhlina: Statistik tersebut sangat menyedihkan. Terdapat beberapa faktor yang dikatakan relevan dengan kematangan dalam sesebuah hubungan perkahwinan. Ini termasuk usia, pekerjaan, pendapatan, kediaman, tahun perkahwinan, status sebelum perkahwinan, tempoh dalam hubungan, bilangan anak, kesihatan, dan juga agama. Terdapat lebih banyak data yang saya percaya relevan, tersedia dan boleh dikumpulkan atau diminta dari pejabat pendaftaran. Anggapkan matlamatnya adalah untuk mengenal pasti faktor-faktor yang berkaitan dengan pasangan yang bercerai. Pengenalan corak yang dilakukan melalui teknik peraturan persatuan (association rules) adalah sangat berguna supaya agensi berkaitan boleh memilih aktiviti yang bersesuaian dalam menangani kes-kes yang terlibat. Sebagai contoh menjalankan kaunseling dan menyediakan sebarang aktiviti sokongan lain. Melalui peramalan risiko penceraian pasangan, pembimbing ataupun kaunselor dapat mengambil strategi kaunseling yang berkesan berdasarkan latar belakang pasangan melalui model penganalisisaan preskriptif.
Dalam contoh ini, analitis data boleh dimulakan dengan mengasingkan data mengikut tahun, negeri, kumpulan umur, agama dan sebagainya. Kemudian, penerokaan statistik yang diringkaskan akan membolehkan gambaran keseluruhan data disusun. Langkah yang boleh dilakukan seterusnya ialah membandingkan semua granulariti (atau unit) kategori data, seperti tahun pertama hingga tahun kedua melalui jumlah kes purata dan memperoleh sisihan piawai bagi membolehkan kita melihat corak; sama ada bilangan kes meningkat atau berkurangan. Perwakilan visual berkesan dapat membantu pengguna dalam memahami data. Kemudian, dengan memisahkan atau mengagregatkan data mengikut granulariti yang sesuai, korelasi boleh dilakukan untuk melihat hubungan antara setiap faktor dengan keputusan perceraian. Pembersihan data, integrasi dan transformasi yang bersesuaian dapat dilakukan sebelum membangunkan model ramalan. Sekiranya model intervensi penceraian ini berjaya dibangunkan, ia boleh membantu dalam menyelamatkan perhubungan pasangan suami isteri, lantas memberikan ruang untuk pasangan memperbaiki hubungan.
TraXX.FM: Analitis data dikatakan sebagai salah satu kemahiran yang sangat dituntut sekarang ini. Apakah pandangan anda mengenai perkara ini?
Dr. Nurfadhlina: Ini memang dijangka memandangkan jumlah data raya yang dihasilkan berlaku atas dorongan peningkatan teknologi penyimpanan digital dan capaian rangkaian yang kian meluas. Maklumat yang terkumpul apabila dieksploitasi dengan betul akan memberikan sesuatu hasil yang menarik; hinggakan muncul pepatah moden menyatakan data adalah minyak baru (data is the new oil).; merujuk kepada perubahan daripada galian minyak kepada ‘galian’ data. Lebih-lebih lagi, era Revolusi Industri 4.0 banyak mendapat manfaat daripada gabungan analitis data dan kecerdasan buatan untuk menyediakan infostruktur yang menyokong keputusan penting yang bakal mencabar pendekatan perniagaan tradisional yang tidak berkesan dan semakin lapuk dengan peredaran zaman.
TraXX.FM: Memandangkan potensi analitis data begitu besar, bagaimana dengan anggaran perbelanjaan penggunaan teknologi ini kepada pengguna atau organisasi?
Dr. Nurfadhlina: Terdapat beberapa perisian komersil yang boleh dilanggan oleh organisasi. Harga sewaannya bergantung kepada ciri-ciri dan fungsi yang ditawarkan dalam perisian tersebut. Walaubagaimanapun, perisian jenis ini adakalanya kurang fleksibel dan manfaatnya terhad kepada fungsi yang telah ditetapkan sahaja. Akan tetapi, kelebihan perisian jenis ini adalah ianya boleh digunakan oleh semua pengguna, walaupun dengan kemahiran penganalisaan data aras rendah. Namun, perlu diingatkan bahawa penggunaan perisian kepintaran perniagaan atau business intelligence tidak semestinya bermaksud penganalisaan data. Tahap kepintaran penyokongan pembuatan keputusan melalui penganalisaan data yang terperinci mempunyai manfaat yang jauh lebih tinggi.
Jika menggunakan perisian yang melibatkan pengaturcaraan, pekerja dengan kemahiran penganalisaan data yang tinggi mampu membangunkan fungsi-fungsi tertentu berdasarkan keperluan ataupun masalah yang ‘unik’ kepada sesuatu organisasi. Pada masa kini, banyak organisasi seperti CIMB, MAYBANK dan Axiata sudah mula melatih dan mengambil pekerja baru dengan kemahiran analitis data supaya dapat menjana keuntungan dan menjimatkan operasi. Kerjaya ini dikenali sebagai saintis data dan gajinya agak tinggi dan dijangka tenaga kerja baru diperlukan dalam bidang ini semakin meningkat pada masa akan datang. Walaupun gaji mereka tinggi daripada kadar purata, namun perbelanjaan organisasi kepada pekerja ini adalah setanding, malahan amat berbaloi, berbanding dengan pergantungan kepada perisian kerana sifat menggunakan manusia sebagai aset adalah lebih elastik dan boleh dipelbagaikan.
TraXX.FM: Apakah ramalan anda mengenai peranan teknologi analitis data untuk pembangunan Malaysia?
Dr. Nurfadhlina: Terdapat pelbagai agensi sudah mula sedar mengenai manfaat daripada analitis data dalam membuat keputusan pintar. Antaranya dengan penyediaan infrastruktur dan infostruktur bagi menampung analitis data raya oleh pihak MAMPU. MAMPU merupakan sebuah badan yang betanggungjawab dalam mengalakkan pemodenan dan transformasi digital oleh kerajaan Malaysia. Langkah pertama yang telah dilakukan adalah menggalakkan budaya perkongsian data, di mana agensi pemunya data menyediakan data di dalam format yang boleh dibaca oleh mesin (seperti format csv). Data di dalam format ini boleh digunasama dan diintegrasi dengan mudah bagi proses penganalisaan data pada peringkat seterusnya. Polisi dan strategi berkaitan juga sedang dibangunkan oleh MAMPU bagi menyediakan tulang belakang ke arah transformasi ekonomi digital. Pihak MAMPU juga telah mula melaksanakan analitis data raya melalui empat aplikasi rintis, iaitu:
- Kawalan Harga – Kementerian Perdagangan Dalam Negeri, Koperasi dan Kepenggunaan (KPDNKK).
- Analisis Sentimen – Unit Pemodenan Tadbiran dan Perancangan Pengurusan Malaysia (MAMPU)
- Pencegahan Jenayah – Polis Di Raja Malaysia (PDRM)
- Ramalan Penyakit Berjangkit – Kementerian Kesihatan Malaysia (KKM)
TraXX.FM: Adakah bakal wujud kesan sampingan daripada perlaksanaan analitis data? Apa yang boleh dilakukan untuk mengurangkan kesan ini?
Dr. Nurfadhlina: Kesan sampingan yang mungkin akan berlaku ialah cabaran di dalam perubahan budaya yang sedang diamalkan oleh banyak organisasi. Sebagai contoh, pergantungan kepada maklumat bentuk digital akan menjadi semakin meluas. Kualiti data yang dikumpul, disimpan dan dihasilkan juga perlu dititikberatkan. Bagi tujuan ini, infrastruktur yang sesuai perlu disediakan bagi memudahkan proses terlibat. Sekiranya wujud infrastruktur yang mesra pengguna, perubahan budaya melalui projek rintis akan lebih cepat berlaku kerana ia kurang membebankan pemegangtaruh (stakeholders) seperti pekerja organisasi, lantas membentuk budaya kerja yang sihat. Pemegangtaruh juga akan lebih bersemangat untuk menyumbang bagi memastikan objektif transformasi organisasi tercapai.
TraXX.FM: Apakah persediaan yang diperlukan untuk mengubah negara supaya kita semua mampu menikmati teknologi ini dalam masa terdekat?
Dr. Nurfadhlina: Perkara pertama ialah kesediaan untuk menerima perubahan dan kesediaan untuk berubah dan menyediakan keupayaan yang sesuai untuk perubahan. Ini termasuk melengkapkan organisasi dengan pekerja berkemahiran dalam analitik data raya, penyediaan platform dan penggunaan infrastruktur digital yang cekap bagi pengumpulan, penyimpanan dan pemprosesan data serta pembudayaan memanfaatkan data yang diperoleh supaya pengurusan organisasi selaras dengan keperluan pelanggan kearah pengoptimuman keuntungan daripada pelaburan. Bagi tujuan ini, pendengar boleh mula melengkapkan diri dengan mengikuti program latihan berkaitan analitis data raya. Pelbagai kerjaya bakal dibentuk, seperti saintis data, penganalisa data, pemodel data dan pelombong data dan jawatan ini boleh diisi oleh graduan dalam bidang teknologi maklumat yang sedia terlatih. Polisi berkaitan data raya dapat dijalankan daripada sokongan penuh pemegangtaruh. Ini dapat mentransformasikan ekonomi digital pada skala besar dengan perkongsian runcitan daripada entiti-entiti yang lebih kecil secara bersama.