Proses Kerja Data Scientist – Penjelasannya bagi Pemula

proses kerja data scientist
Proses Kerja Data Scientist (Foto: Freepik)

Bagi kamu yang baru belajar mengenai data science, mungkin akan muncul pertanyaan semacam, ‘Seperti apa pekerjaan data science?’, ‘Bagaimana data scientist melakukan pekerjaan mereka sehari-hari?’ atau ‘Bagaimana sebenarnya proses kerja data scientist berjalan?’. Pertanyaan-pertanyaan ini tentu tidak mudah dijawab, salah satunya disebabkan oleh perbedaan cara kerja masing-masing data scientist maupun peran yang mungkin berbeda di setiap perusahaan.

Untungnya, untuk menjawab dan menjelaskan pertanyaan tersebut, Raj Bandyopadhyay, Direktur Data Science Education di Springboard telah merumuskan jawaban yang dapat dengan sangat mudah dipahami, bahkan oleh pemula sekalipun. Jika kebetulan kamu memiliki pertanyaan yang sama, yakni seputar proses data science, berikut jawaban termudah yang bisa kamu temukan.

6 Proses Kerja Data Scientist

Rumuskan permasalahan

Tugas seorang data scientist adalah menemukan jawaban dan solusi dari permasalahan perusahaan. Untuk itu, hal pertama yang harus dilakukan oleh seorang data scientist adalah mendeterminasikan secara persis masalah yang harus diselesaikan. Hal ini terlihat mudah, namun menjadi proses fundamental dalam kerja data scientist. Seorang data scientist sangat mungkin mendapatkan masukan mengenai berbagai masalah dari berbagai sumber. Dari berbagai masalah ini, data scientist harus mampu menerjemahkannya menjadi sebuah tindakan yang solutif.

Sebut saja, Manajer Penjualan perusahaan menyampaikan sebuah permasalahan. Data scientist harus mampu memahami permasalahan yang disampaikan serta tujuan yang ingin dicapai dari pengolahan data. Sebelum menemukan solusi yang tepat, data scientist harus mampu untuk mengkristalkan permasalahan dan cara terbaik melakukannya adalah dengan mengajukan pertanyaan yang tepat.

Seperti apa pertanyaan yang tepat itu? Data scientist dapat mengajukan set pertanyaan kepada Manajer Penjualan seperti di bawah ini:

  1. Siapa konsumen kita?
  2. Mengapa mereka membeli produk kita?
  3. Bagaimana kita memprediksikan konsumen akan membeli produk kita?
  4. Bagaimana perbedaan segmentasi kelompok yang melakukan pembelian lebih baik dibandingkan segmentasi kelompok lain?
  5. dan seterusnya

Dalam merespons pertanyaan tersebut, Manajer Penjualan akan menunjukkan data yang dimiliki mengenai konsumen perusahaan. Jika Manajer Penjualan bermaksud mengembangkan penjualan kepada segmentasi kelompok lain, maka tugas data scientist adalah untuk menganalisis masalah tersebut dan memahami keseluruhan informasi yang dapat membantu mendukung tercapainya konklusi yang kuat.

Menghimpun RAW Data yang diperlukan

Setelah berhasil mendefinisikan masalah, selanjutnya data scientist membutuhkan seluruh informasi yang dibutuhkan mengenai masalah tersebut demi dicapainya sebuah solusi. Proses ini meliputi pencarian dan penyeleksian seluruh data yang kemungkinan dibutuhkan, cara mendapatkan data tersebut baik itu dari sumber internal maupun eksternal.

Data scientist dapat menemukan data yang disimpan oleh bagian penjualan, atau software manajemen pelayanan konsumen. Dari data yang dimiliki, data scientist dapat mengekspornya menjadi file bertipe CSV untuk selanjutnya dilakukan analisis.

Memproses data untuk analisis

Semua data mentah atau raw data telah diperoleh. Namun, sebelum dapat menggunakan data tersebut untuk dianalisis, data scientist perlu untuk memprosesnya terlebih dulu. Sebab, seringkali data yang dimiliki masih begitu berantakan dan acak terutama bila data tersebut belum pernah dikelola dengan baik. Jika memaksakan data mentah dianalisis, maka akan ditemukan error yang dapat mengacaukan analisis. Value dari analisis data dapat bernilai nol, bernilai ganda (terduplikasi), atau bahkan menghasilkan value yang keliru. Untuk itu, sangat penting untuk mengecek data mentah agar proses analisis dapat menghasilkan nilai yang akurat.

Ada beberapa kesalahan umum yang biasa dilakukan dalam pengecekan, yakni:

  1. Missing value
  2. Corrupted value
  3. Perbedaan zona waktu
  4. Data range error

Dibutuhkan pengecekan dalam kolom dan tes value untuk memastikan value yang dihasilkan masuk akal. Jika terdeteksi data yang tidak masuk akal, maka data scientist perlu menghilangkan atau menggantinya dengan default value. Di sinilah intuisi sangat berperan dalam kerja data scintist.

Eksplorasi Data

Jika data yang dimiliki sudah ‘bersih’ maka proses selanjutnya adalah mengeksplorasinya. Data scientist tentu bekerja dengan tenggat waktu, untuk itu prioritas permasalahan wajib dilakukan. Temukan pola menarik yang dapat menjelaskan alasan rendahnya penjualan pada kelompok tertentu. Data scientist akan menemukan pola tertentu seperti sebagian besar kelompok ini tidak aktif di media sosial, tidak memiliki Twitter/ Facebook, atau usia yang lebih tua daripada kelompok yang aktif membeli. Berdasarkan informasi ini, data scientist akan dapat melakukan eksplorasi pola secara lebih mendalam.

In-depth Analysis

Proses ini adalah tahap diaplikasikannya wawasan dan kemampuan statistik, matematikan dan teknologi, serta menggunakan tools data scientist yang dibutuhkan untuk mengolah dan menemukan semua informasi yang dapat didapat. Dalam proses ini pula, data scientist dapat membuat sebuah model prediktif yang membandingkan antara kelompok dengan pembelian tinggi dan kelompok dengan pembelian rendah. Salah satu temuan yang bisa didapatkan adalah ketidakaktifan kelompok dengan pembelian rendah di media sosial.

Dengan demikian, data scientist dapat menemukan bahwa perusahaan cenderung terpusat dalam penggunaan pemasaran melalui media sosial. Dengan kata lain, target yang mudah terjangkau adalah generasi muda. Berdasarkan hal ini pula, data scientist mungkin dapat menemukan bahwa kelompok dengan pembelian rendah lebih mudah dijangkau melalui pemasaran telepon dibandingkan media sosial.

Strategi pemasaran yang lebih personal dan interaktif menjadi solusi yang dapat ditawarkan kepada Manajer Pemasaran untuk meningkatkan penjualan pada kelompok yang dituju.

Mengomunikasikan hasil analisis

Proses terakhir dari kerja data scientist adalah mempresentasikan atau mengomunikasikan hasil dari analisis yang telah dilakukan. Seorang data scientist diharapkan memberikan solusi dan alternatif strategi berdasarkan analisis yang telah dilakukannya. Oleh karenanya, akan lebih baik bila data scientist tidak datang hanya dengan solusi tunggal, namun dengan pilihan beserta performa serta posibilitas keberhasilan strategi tersebut.

Dalam proses ini, softskill data science yakni interpersonal communication sangat berpengaruh. Data Scientist harus mampu mengomunikasikan hasil temuannya dengan bahasa yang mengalir dan mudah dimengerti oleh lawan bicaranya. Jelaskan secara runut permasalahan, sumber masalah, pola beserta solusinya. Dengan demikian, manajemen akan dapat mengambil sikap terbaik dalam merespons saran dari data scientist ini.

Enam proses kerja data scientist ini nampak mudah bukan? Namun tentu saja, banyak hardskill dan softskill yang diperlukan untuk mampu melakukan peran ini? Tertarik untuk bisa menguasai hardskill dan softskill data science dalam tiga bulan? Daftar SkolaClass Data Science di Digital Skola. Belajar dari nol sampai siap kerja.

Leave a Reply

Your email address will not be published. Required fields are marked *