Data Science dan Machine Learning

Dalam era Big Data pada era 4.0 seperti sekarang ini, dari berbagai kalangan selalu membicarakan topik yang disebut dengan istilah data science. Bahkan ditelinga kita sudah terlalu terbiasa untuk mendengarkan sebutan ilmu keren nan baru yang satu ini. Tapi rasa-rasanya sungguh sangat membosankan apabila kita hanya mendengar istilah ini, tanpa mengetahui secar detail, apa itu sebenarnya pengertian Data Science itu.

Sempat juga timbul asumsi dan berbagai pertanyaan, bagaimana bias perusahaan raksasa google menciptakan mobil tanpa pengemudi (autonomous) ? Bagaimana langkah tahapan dalam suatu website muncul sebuah iklan tentang barang yang sering kita cari sebenarnya? Bagaimana mungkin sebuah akun media sosial dapat merekomendasikan konten artikel, web page ataupun user lain untuk kita ikuti (follow)? Dan berbagai pertanyaan bagaimana lainnya. Dan semua itu merupakan fenomena teknologi Big Data. Dengan munculnya berbagai platform sebagai tempat kita berbagi cerita, foto, data diri dan lain sebagainya, menunjukkan bahwa tingkat keamanan data milik kita pribadi sudah tidak menjadi hal yang bersifat “privasi” lagi. Jumlah data-data yang tersimpan dalam storage menjadi luar biasa banyak tak terbendung, bahkan keberadaan data - data tersebut dapat digunakan untuk kejahatan dan kriminalitas apabila tidak dikelola secara baik.

Dan oleh karena itu, peranan data science sangat penting dalam era Big Data pada saat ini. Dimana berbagai jenis varian data baik yang terstruktur maupun tidak terstruktur dapat dianalisa dengan baik dan akurat. “Data science” dideskripsikan suatu integrasi data dan gabungan dari berbagai konklusi data, pengambilan keputusan pengembangan desain pola algoritma khusus,serta tata cara penggunaan sebuah teknologi untuk memecahkan suatu permasalahan perihal aspek analisis yang berbentuk tersaji berurutan dalam suatu kompleks dan rumit. “Data science” pada kenyataanya lebih berfokus secara utuh kepada pemrosesan dan tahapan penggalian (mining) data dan informasi ataupun berupa analisa sistem yang bersifat prediktif dan probability pada suatu kumpulan penyimpanan data (storage) untuk difilter  secara menyeluruh serta ditemukan data-data yang benar agar dapat menghasilkan suatu output sumber daya (resource) data yang akurat dan valid sesuai dengan data yang sesungguhnya. Dalam “Data Science” tidak hanya mengandalkan disiplin ilmu sains saja, namun ada beberapa cabang ilmu lain yang harus dimiliki untuk memahami bidang ini.

Untuk selengkapnya simak beberapa point-point penting diantaranya adalah sebagai berikut :

-       Memiliki pemahaman secara luas tentang konsep SQL, Python, R, SAS, Scala

Seorang data scientist sendiri harus memiliki aspek kreativitas dan kecerdikan dalam menggunakan keterampilan skill teknis untuk membangun berbagai hal dan menemukan solusi cerdas dalam suatu masalah yang akan terjadi. Mengapa hal demikian dianggap penting dan krusial?Pada tahapan awal kita akan mempelajari, yaitu datafication, berbagai kumpulan data dari beraneka sumber literasi harus dipersiapkan terlebih dahulu supaya dapat dibaca oleh program komputer. Pada tahapan ini membutuhkan keahlian di bidang ilmu komputer. Dikarenakan mereka menggunakan teknologi untuk memperebutkan set data aktif yang sangat besar, bekerja dengan algoritma yang cukup rumit, dan hal demikian membutuhkan alat yang jauh lebih canggih dan modern daripada sekedar menggunakan MS-Excel.

Para data scientists sendiri harus mampu membuat sebuah kode untuk solusi yang cepat berupa prototype, serta mengintegrasikan dengan sistem data yang sangat kompleks. Bahasa inti yang terkait dengan bidang disiplin ilmu data termasuk SQL, Algorithm beserta pemrograman dengan Python, R, Scala, SAS, dan lain sebagainya. Akan tetapi pada hakekatnya tidak hanya sebatas dalam mengetahui dasar-dasar bahasa, melainkan mampu secara kreatif dan inovatif dalam menavigasi jalan mereka untuk membuat barisan kode mereka bekerja secara normal.

Memiliki Pengalaman secara Langsung Dalam Manajemen Basis Data SQL

Mereka harus berpengalaman ahli dan kompeten dalam pengolahan manajemen basis data menggunakan metode query SQL untuk dapat memahami pola arah aliran data yang cukup rumit dan menggunakan logika mereka secara baik dan benar. Beberapa cabang disiplin ilmu lain yang harus mereka mengerti adalah Advanced Database dan Data Warehouse.

Kemampuan Untuk Bekerja Dengan Bentuk Data Yang Tidak Terstruktur Dari Berbagai Sumber Seperti Video, Media Sosial, dan konten-konten lainnya.


Hal ini berhubungan dengan teknologi Big DataBig Data sendiri dapat diartikan dengan suatu cara dan langkah untuk mengambil, menyimpan, menganalisis serangkaian data-data yang sebelumnya tidak memungkinkan untuk mengambil, menyimpan, memproses, dan menganalisa. Sehingga memungkinkan terdapat data yang mengalami error dan tidak dapat diproses dengan hal-hal yang biasa. Maka tugas dan peranan seorang data scientist harus menemukan cara bagaimana nantinya data akan diproses dan menjadikan data itu dapat disimpan dan diatur dengan cara yang sistematis dan terstruktur.

Memahami Beberapa Fungsi dan Manfaat Analisis

Analisis yang cukup populer dalam istilah bisnis yang populer beberapa tahun terakhir ini. Analisis dimaksudkan disini untuk menggambarkan pemikiran kritis dan logis yang bersifat kuantitatif. Secara teknis sendiri, analitik adalah “ilmu analisis” — dengan cara yang lain, praktik menganalisis kumpulan informasi dan data untuk membuat suatu keputusan. Analis dapat berinteraksi secara langsung dengan data pada tingkat database ataupun tingkat laporan yang sedang dirangkum.

Dalam kondisi apabila data yang diperlukan sudah siap,untuk selanjutnta tugas berikutnya lebih banyak melibatkan bab ilmu statistika, optimasi, serta penalaran matematis. Tidak mengherankan lagi,apabila seorang Data Scientist itu ternyata harus menguasai tehnik Statistics for Data Science, Bayesian Decision Theory, Predictive Analytics, serta Probabilities and Data. Sehingga diharapkan mereka dapat menganalisis data dengan baik dan benar melalui cara pemrosesan sebuah sinyal, model probabilitas, program komputer dan hal-hal yang berkaitan dengan ilmu pengetahuan sains dan teknologi lainnya.

 

Memahami Teknologi Machine Learning

 

Istilah Machine Learning sendiri dapat didefinisikan sebagai hasil dari penggunaan suatu algoritma untuk mengelola data, dipelajari dan kemudian menghasilkan suatu prediksi. Software Machine Learning terdiri dari unsur analisis statistik dan analisis prediktif yang dapat digunakan untuk menemukan suatu pola dan menangkap wawasan yang tersembunyi berdasarkan kumpulan data yang dirasakan.

Contoh konkret dari implementasi Machine Learning adalah platform social media Facebook. Keberadaan algoritma Machine Learning Facebook sendiri mengumpulkan informasi perilaku dan kebiasaan dari setiap pengguna pada platform sosial. Sehingga berdasarkan perilaku para pengguna sebelumnya, kinerja algoritma akan memprediksi minat dan merekomendasikan artikel-artikel dan pemberitahuan di halaman Umpan Berita.

Contoh lainnya adalah pada platform Google Translate,pada Google sendiri tidak menerjemahkan kata demi kata. Diambil dari sebuah konferensi internasional, publikasi ilmiah,serta koleksi perpustakaan, aneka serangkaian teks akan disandingkan dengan terjemahannya, kemudian disimpan dalam bentuk arsip digital. Tiap komponen frasa dan kalimat dikaitkan dengan terjemahannya, kemudian dicari korelasi pada setiap frasa dan kalimat.

Intinya dengan menggunakan algoritma tertentu, antara data yang satu dikaitkan dengan data yang lain secara statistik. Ketika jumlah data kian bertambah, alhasil computer akan menghasilkan lebih banyak korelasi. Sehingga intinya, komputer menjadi semakin pintar apabila disuplai lebih banyak asupan data. Inilah yang disebut dengan Machine Learning.

Beberapa Kunggulan dari Data Science :

Internet  Of  Things (IoT)

Pada era internet of things (IoT), banyak alat-alat terkoneksi via jaringan internet dan mengirimkan sebuah data. Analisis terhadap machine-generated data ini dapat mengungkap banyak hal-hal baru yang belum diketahui sebelumnya. Sebagai contoh Dibidang kesehatan, misalnya, data kondisi ribuan pasien tersedia di komputer secara lengkap dengan prediksinya. Dokter dapat mengetahui dan mendiagnosa secara detail mengapa obat yang satu efektif dan manjur pada seseorang, akan tetapi tidak pada pasien lain. Berbagai alat yang sudah terpasang pada tubuh pasien akan mensupply jutaan data penting yang mustahil  untuk dipahami tanpa adanya Data Science.

Komputer akan Menjadi Semakin Pintar

Seiring berjalannya waktu,teknologi komputer akan semakin pintar dalam menghasilkan terjemahan yang lebih baik tentunya. Dan itu sebabnya, Machine Learning termasuk dalam materi pokok perkuliahan data science. Pada suatu saat nanti Google dapat menghasilkan suatu terjemahan yang akurat, termasuk dalam menerjemahkan suatu percakapan, dan membuat profesi penerjemah (translator) kian memudar, seperti yang akan menimpa banyak pada profesi lain akibat disrupsi teknologi. Dengan adanya Data Science, kita juga bisa lebih mengetahui secara lengkap dalam memahami perilaku konsumen dalam mencari produk yang diinginkan, seperti perusahaan Amazon yang sukses dalam mengembangkan sistem rekomendasi pembelian beberapa macam item-item lain kepada pengunjung disitusnya.

Jurusan Data Science di Beberapa Negara dan Belahan Dunia

Karena banyak perusahaan raksasa yang memiliki resource data besar di Negara Amerika seperti misalnya Facebook, Google, Amazon, dan LinkedIn, sudah menjadi kewajaran apabila jurusan disiplin ilmu Data Science banyak ditawarkan di negara  sana, antara lain sebagai berikut di Columbia University, New York University, Arizona State University, University of Stanford, dan University of California,.

Di Pemerintah Indonesia pun sudah memahami akan pentingnya penggunaan Big Data. Pada sekarang ini, terdapat sejumlah kurang lebih 25 staff dari beberapa kementerian di Indonesia yang ditugaskan secara khusus belajar di University of South Australia (UniSA). Pada sektor pemerintahan, Big Data pada kenyataannya dapat banyak menghemat dan menekan angka belanja operasional, kasus penggelapan keuangan negara dapat diminimalisir, dan pendapatan dari sector pajak bisa ditingkatkan secara signifikan.

Peluang dibidang karir

Data Scientist sendiri dibutuhkan di berbagai sektor area yang memerlukan analisis statistik dan melibatkan kuantitas data yang sangat besar. Diantaranya sebagai berikut pada bidang aktuaria (asuransi), perbankan , keuangan (finance), telekomunikasi, industri manufaktur, pemasaran (marketing), industry bahan kimia dan farmasi, riset penelitian kesehatan,statistik dan pertahanan militer termasuk yang memerlukan akan keahlian skill ini. Untuk posisi dalam dunia kerja sebagai berikut business analyst, data solutions manager, information systems analyst, market intelligence analyst, dan sejenisnya.


0 komentar:

Post a Comment

Translate

RSS Feed

Enter your email address:

Delivered by FeedBurner

Dark Mode

Popular Posts

Blog Archive