Memahami Apa Itu Data Science Bagi Pemula

digitalskola

digitalskola

13 Januari 2021

Memahami Apa Itu Data Science Bagi Pemula
 Apa Itu Data Science (Photo by Austin Distel on Unsplash)

juta terabyte data yang dihasilkan setiap hari, data-data ini mencakup data yang baru dibuat, diambi, disalin, atau digunakan. Bahkan, 120 zettabytes data yang dihasilkan pada tahun 2023 diprediksi akan meningkat lebih dari 150% pada tahun 2025 atau mencapai 181 zettabytes (Source: Exploding Topics).

Dengan banyaknya data yang diproduksi setiap harinya, membuat perusahaan yang mampu mengelola datanya sebaik mungkin, akan menjadi perusahaan yang berkembang paling pesat. Untuk dapat memanfaatkan besarnya data yang diproduksi setiap harinya membuat perusahaan memerlukan orang-orang khusus untuk dapat mengubah data menjadi suatu informasi, pengetahuan, bahkan menjadi pengambilan keputusan yang tepat. Data tersebut juga dapat diolah dan dimanfaatkan untuk dapat memaksimalkan efektivitas bisnis dalam konteks profitabilitas, manajemen resiko, kepuasan pelanggan dan lain sebagainya.

Untuk itu, diperlukan orang khusus yang mempelajari ilmu data science untuk menangani persoalan ini. Lantas, apa itu data science dan mengapa data science penting? Simak artikel ini sampai akhir!

BACA JUGA: Bocoran Prospek Kerja Sains Data Terkini

Apa itu Data Science?

Apa itu Data Science?

Data science adalah domain studi yang berhubungan dengan volume data yang besar menggunakan alat dan teknik modern untuk menemukan pola yang tidak terlihat, memperoleh informasi yang berarti, dan membuat keputusan bisnis. Data science menggunakan algoritma pembelajaran mesin yang kompleks untuk membangun model prediktif. Dalam pelaksanaannya, Data Science merupakan suatu multidisiplin ilmu yang mempertemukan paling tidak tiga disiplin ilmu lain yakni:

  • Pemrograman = Python, R, Matlab
  • Statistika & Matematika = Aljabar, kalkulus, statistik, geometri, dan optimasi
  • Pengetahuan bisnis atau bidang tertentu

Data yang digunakan untuk analisis dapat berasal dari berbagai sumber dan disajikan dalam berbagai format. Data science juga merupakan multidisiplin ilmu yang menggabungkan:

  • Artificial intelligence = Simulasi kecerdasan manusia yang dibuat dari pemrograman mesin
  • Machine learning = Metode data dan algoritma untuk meniru cara manusia belajar dan meningkatkan akurasi prediksi
  • Deep learning = Subset machine learning yang menggunakan struktur algoritma spesifik yang disebut jaringan neural yang dimodelkan seperti otak manusia

Mengapa Data Science Penting?

Mengapa Data Science Penting?

Data science adalah ilmu yang penting karena bisnis kecil maupun besar kini sangat bergantung pada data. Jika perusahaan tidak bisa mengolah data, maka bisnis tidak akan memiliki pedoman untuk strategi bisnisnya. Ilmu data science juga membantu bisnis untuk pengambilan keputusan, analisis prediktif, dan penemuan pola yang lebih baik. Penerapan data science memungkinkan kamu:

  • Menemukan penyebab utama masalah dengan mengajukan pertanyaan yang tepat
  • Melakukan studi eksplorasi pada data
  • Memodelkan data menggunakan berbagai algoritma
  • Mengkomunikasikan dan visualisasikan hasil melalui grafik, dasbor, dll

Dalam praktiknya, data science telah membantu banyak industri seperti industri penerbangan yang kemudian dapat memprediksi gangguan dalam perjalanan untuk mengurangi kerugian bagi maskapai dan penumpang. Sebagai gambaran berikut pemanfaatan penerapan data science di berbagai industri:

Industri Finance: 

  • Prediksi budget yang dibutuhkan di tahun depan
  • Pengambilan keputusan strategis
  • Analisis risiko
  • Membantu pengelolaan portofolio investasi
  • Meningkatkan efisiensi operasional dan mengurangi biaya 

Industri Banking:

  • Prediksi risiko kredit
  • Deteksi penipuan
  • Mengotomatisasi proses pengajuan pinjaman
  • Pengelolaan informasi nasabah 
  • Mengelola portofolio investasi 
  • Menganalisis aliran kas dan memprediksi kebutuhan likuiditas di masa depan

Industri Penerbangan:

  • Merencanakan rute dan memutuskan penentuan jadwal penerbangan langsung atau lanjutan
  • Membuat model analitik prediktif untuk memperkirakan penundaan penerbangan
  • Menawarkan model promosi yang dipersonalisasi berdasarkan pola pemesanan pelanggan
  • Menentukan kelas pesawat yang akan dibeli untuk kinerja keseluruhan yang lebih baik

Industri Manufacturing:

  • Membantu deteksi kerusakan mesin
  • Otomatisasi unit manufaktur
  • Menganalisis tata letak pabrik dan rute produksi
  • Mengidentifikasi kebutuhan pasar dan mengembangkan produk
  • Melacak dan menganalisis jejak digital produk dari produksi hingga pengiriman

Industri E-Commerce:

  • Identifikasi konsumen
  • Optimasi harga
  • Memberikan rekomendasi produk yang dipersonalisasi berdasarkan preferensi, riwayat pembelian, dan perilaku penelusuran
  • Menganalisis data harga, persaingan, dan permintaan pasar
  • Mendeteksi pola-pola yang mencurigakan dalam transaksi e-commerce 

Industri Healthcare:

  • Analisis rekam medis
  • Asisten virtual
  • Membuat profil kesehatan individual untuk pasien dan menyesuaikan perawatan medis secara personal 
  • Pengembangan sistem pemantauan pasien
  • Penelitian obat

Proses Data Science

Mengutip Towards Data Science, ada lima proses data science, diantaranya: 

Obtain

Proses data science yang pertama adalah obtain yaitu mengumpulkan data, umumnya data akan dikumpulkan dari berbagai sumber seperti:

  • Hasil survei
  • Media sosial
  • Data pelanggan

Data-data yang sudah dikumpulkan tersebut kemudian akan diproses menggunakan MySQL, Python, atau R.

Scrub

Selanjutnya setelah data dikumpulkan, hal yang dilakukan adalah scrubbing yaitu pembersihan atau filter data. Pada tahap ini, jika ditemukan data yang tidak relevan atau tidak penting maka data tersebut harus disingkirkan. Di tahapan ini juga akan dilakukan standardisasi format data yang tadinya data memiliki format bermacam-macam dikonversi ke satu format yang sama. Pada proses scrubbing juga jika ditemukan data yang hilang atau kurang akan dilakukan penyesuaian. 

Explore

Pada tahapan ini, data akan diperiksa. Berikut tahapan pemeriksaan data:

  • Data diperiksa propertinya, jika ada tipe data yang berbeda maka perlakuannya juga harus berbeda pula
  • Statistik deskriptif dihitung untuk bisa mengekstrak fitur dan menguji variabel
  • Visualisasi data untuk mengidentifikasi pola dan tren dalam data

Model

Setelah memastikan tahap scrub dan explore selesai, maka selanjutnya masuk ke tahapan model menggunakan regresi dan prediksi untuk memperkirakan nilai di waktu mendatang dan melakukan klasifikasi serta pengelompokan grup nilai dari data. 

Interpret

Tahap terakhir dari proses data science adalah interpretasi model dan data. Hasil dari pengolahan data yang diinterpretasi harus bisa dipahami oleh orang-orang awam. Oleh karena itu, pada tahapan ini data scientist harus memiliki kemampuan komunikasi yang baik agar bisa menyampaikan poin-poin penting secara efektif. 

Orang di Balik Penerapan Data Science

Orang di Balik Penerapan Data Science
Data Scientist (Photo by Data Science Dojo)

Orang di balik penerapan ilmu data science adalah data scientist yaitu orang yang yang dapat mengambil sekumpulan data, mengembangkan kasus penggunaan untuk data tersebut, membuat hipotesis tentang cara memanfaatkannya, melakukan eksperimen menggunakan hipotesis yang dikembangkan, menganalisis hasil, dan menemukan solusi. Seorang data scientist menganalisis data bisnis untuk mengekstrak wawasan yang bermakna. Dengan kata lain, data scientist menyelesaikan masalah bisnis melalui serangkaian langkah, antara lain:

  • Mengajukan pertanyaan yang tepat untuk memahami permasalahan
  • Mengumpulkan data dari berbagai sumber — data perusahaan, data publik, dll
  • Memproses data mentah dan mengubahnya menjadi format yang sesuai untuk analisis
  • Memasukkan data ke dalam sistem analitik — algoritma Machine Learning atau model statistik
  • Menyiapkan hasil dan wawasan untuk dibagikan pada pemangku kepentingan yang sesuai

Untuk bisa menjadi data scientist kamu harus menguasai hal-hal berikut: 

  • Statistik
  • Aljabar linier
  • Kalkulus
  • Pemrograman
  • Basis data
  • Komputasi terdistribusi
  • Pembelajaran mesin
  • Visualisasi
  • Desain eksperimental
  • Deep Learning

Tingginya akan kebutuhan data scientist yang skill mumpuni membuat profesi ini menjadi salah satu profesi yang kisaran gajinya terbilang tinggi. Di Indonesia, rata-rata gaji data scientist berkisar 8-61jt/bulan (Source: Glassdoor). Tentunya besaran gaji data scientist ini dipengaruhi oleh berbagai faktor seperti:

  • Skala perusahaan
  • Lokasi perusahaan
  • Tahun pengalaman
  • Level manajerial
 Gaji Data Scientist
Gaji Data Scientist (Photo by Glassdoor)

BACA JUGA: Fantastis! Ini Gaji Data Scientist Fresh Graduate

Hasil Pekerjaan Data Scientist

Hasil Pekerjaan Data Scientist
                               Hasil Pekerjaan Data Scientist (Photo by Tirza van Dijk on Unsplash)

Dalam implementasinya ilmu data science diterapkan oleh seorang data scientist. Hasil pekerjaan data scientist berupa:

  • Decision Support = Hasil pekerjaan data scientist meliputi seluruh aktivitas pembuatan report dan dashboard yang digunakan untuk keputusan bisnis pagi para pengambil keputusan
  • Scoring = Memprediksi nilai pada data
  • Recommendation = Menemukan hubungan-hubungan antar berbagai informasi yang akan dijadikan rekomendasi 
  • Classification = Memprediksi kategori pada data
  • Forecasting = Memperkirakan nilai, pola, dan trend pada periode berikutnya
  • Detection = Menentukan risiko atau peluang sebagai tindakan antisipasi terhadap fraud

Yuk Mulai Perjalanan Belajar Data Science bersama Digital Skola!

Yuk Mulai Perjalanan Belajar Data Science bersama Digital Skola!
Belajar Data Science (Photo by Thomas Lefebvre on Unsplash)

Jika kamu saat ini tertarik untuk belajar lebih banyak mengenai ilmu data science, kamu kamu bisa belajar bersama mentor expert di kelas Data Science Digital Skola. Di kelas ini, kamu akan belajar ilmu data science paling update sesuai dengan kebutuhan industri. Kelas ini dirancang untuk pemula sehingga bisa diikuti oleh siapa saja tanpa latar belakang IT. Berikut outline materi ilmu data science yang akan kamu pelajari di kelas:

  • Data Science Methodology
  • SQL
  • Programming with Python
  • Analytics with Numpy
  • Statistics
  • Data Visualization
  • Git & Version Control System
  • Dataframe
  • Machine Learning

Selain belajar hardskill ilmu data science, kamu juga akan mendapatkan pelatihan softskill, bimbingan professional branding, hingga career mentoring bersama HR expert untuk mempersiapkan dirimu menjadi data scientist andal. Tunggu apa lagi? Cek info lengkap mengenai kelasnya dengan klik button di bawah! 

chat