Data Scientist Instant!

Data Scientist Instant!

Saya sebenernya mau post tulisan ini sejak lama tapi lupa terus, nah barusan saya lihat tulisannya mas Taufik Sutanto tentang “Data Science bukan Mie Instant” jadi tergelitik untuk post, siapa tau bermanfaat.

Gambar di atas ini adalah screenshoot akun Kaggle saya, kalau pas ada waktu luang biasanya saya nyobain ikut kompetisi di Kaggle, iseng-iseng berhadiah lah. Apakah ini bener-bener berguna?

Begini, saya mau cerita dulu, dulu habis saya lulus S2 dari Chonnam, tiba-tiba teman satu lab saya nawarin untuk kerja di tempat dia, salah satu perusahaan multinasional pusatnya di Western Cape, South Africa, kerjanya remote jadi backend engineer python. Saya menyanggupinya dan akhirnya sama dia saya dikenalkan ke bosnya. Pertanyaanya, apakah mereka minta ijazah master saya? tidak sama sekali, yang mereka minta bahkan juga bukan CV, melainkan link profil Github.

Beruntungnya saya sering iseng-iseng klo ngerjain proyek kecil2an, sy push di github jadi publik repo, sapa tau orang lain tertarik atau mungkin bisa manfaat buat orang. Nah sama pak bosnya ini tinggal di check aja github saya, terus diminta skype, ngobrol tentang codingan saya di Github.

Nah, saya kan mau switch karir nih dari yg sebelumnya di software, mau jadi data scientist lah, makanya nyoba ambil S3 biar analytical thinkingnya terasah. Oleh karenanya diwaktu luang saya coba bangun portofolio, klo software engineer ya portonya Github, klo data scientist ya tentu Kaggle.

Jujur pingin ikut kompetisi yang seriusan, dulu pernah ikut kompetisi Shopee cuman ya tentu waktu sy sudah tdk flexible lah. Akhirnya ya klo ada waktu luang aja nyobain kompetisi di Kaggle, krn range nya kan biasanya cukup lama ada yg 1 bulan bahkan.
Jujur, sayapun di Kaggle kadang gak sempet coding from scratch, yang saya lakuin biasanya lihat codingan orang yang sudah disubmit disitu, saya coba lihat-lihat, misal ini kyaknya ada yg kurang, harusnya fitur ini jangan dipake, atau misal ganti parameternya, dsb, nah ternyata beberapa bisa tuh accuracynya lebih bagus, dan so far dapet 2 medali hehehe ay walaupun belum pernah juara dan dpt uang sih hehe.

Jadi sharing saya bagi teman-teman yang pingin terjun ke data scientist, serius Kaggle ini sangat-sangat berguna. So far dengan porto ini saya dapat beberapa proyek data science freelance kok.
Satu lagi, menyambung tulisan mas Taufik tadi, gak ada yang instant woy, dan itu bener. Banyak orang bilang, Mau jadi programmer gak harus punya basic IT ya, itu betul, tp nanti biasanya akan kelihatan, ketika nanti udah mulai nyampe ttg struktur data, kenapa kamu pakai list, kenapa gak pakai set, kenapa pake nested loop? ini kan O(n2), kenapa gak gini.

Ada yg bilang ikut bootcamp 10 hari udah bisa jadi data scientist kok, klo menurut saya tidak lah, itu mungkin hanya pengenalan, nanti ketahuan kok. Saya pernah kerja bareng anak bootcamp data science, sebelumnya backgroundnya programmer, secara coding ok lah. Cuman ketika nyampe di satu persoalan misalnya, ada missing values, dan itu missingnya banyak di datasetnya. Tiba-tiba dia mau filling missing values, dan dia pakai mean, jadi data NaN bakal di ganti sama mean dari tiap column. Saya tanya ke dia, kenapa pakai approach itu? kamu sudah check belum distribusi datanya, yakin dia normal, klopun normal yakin pakau approch itu? gimana klo distribusinya skewed? Dia ndak bisa njawab.

Jadi intinya, proses itu penting, dan bagi yang maujalan ke arah sana (data scientist), saya sangat merekomendasikan Kaggle!
Silahkan kalau mau follow Kaggle saya
https://www.kaggle.com/rischan

Salam dari Brisbane,
Rischan

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.