Kurikulum GRATIS Data Science

Kurikulum GRATIS Data Science

·

8 min read

Roadmap Data Science by Data Science Indonesia

Apa kabar semuanya! Perkenalkan saya Rizky, seorang Data Science Enthusiast & Web Developer. Artikel ini merupakan artikel teknis pertama saya, jadi mohon maaf jika banyak kekurangan. Di dalam artikel kali ini, saya akan memaparkan roadmap/jalan untuk menjadi seorang Data Scientist.

Sebelum membahas isi dari kurikulum ini, saya akan memberi penjelasan singkat tentang Data Science, kenapa harus belajar tentang data, masalah umum yang sering dialami oleh pemula beserta solusinya dan alasan saya membuat kurikulum ini.

Alasan Membuat Kurikulum Ini

  1. Kekurangan ekonomi membuat saya harus menjadi seseorang yang resourceful (mampu berpikir out the box/kreatif). Saya memilih untuk tidak kuliah dan memutuskan untuk bekerja karena saya tidak ingin menyusahkan kedua orang tua saya, saya bertekad kalau saya mau kuliah, harus dari hasil jerih payah saya sendiri. Self taught alias otodidak merupakan jalan yang saya pilih karena tentunya gratis dan fleksibel sehingga bisa disesuaikan dengan kebutuhan dan waktu yang saya miliki.
  2. Sambilan membantu diri saya, dengan membagikan kurikulum ini saya juga bisa membantu banyak orang, siapa tau kurikulum ini bisa membantu seseorang mendapatkan karir yang diimpikan. Jika kurikulum ini bisa membantu satu orang saja, saya sudah sangat senang.

Apa itu Data Science?

Data Science Landscape by Data Professor

Data Science adalah karir yang lagi "hot" sekarang, sampai-sampai mendapat julukan "The Sexiest Job of the 21st Century". Menurut saya, alasan utama yang membuat Data Science menjadi pilihan karir yang sangat populer adalah umurnya yang masih relatif muda sehingga tidak banyak orang yang memiliki skill di bidang ini, ditambah lagi dengan gajinya yang terbilang cukup fantastis.

Data Science merupakan ilmu yang terdiri dari ilmu komputer (Computer Science), statistika, matematika dan domain expert tertentu. Secara umum, posisi Data Scientist didefinisikan sebagai gabungan dari tiga posisi sekaligus yaitu Data Engineer + Dana Analyst + Machine Learning Engineer (perusahaan tertentu bisa saja memiliki definisi yang berbeda). Tugas dari seorang Data Scientist adalah mendapatkan data yang diperlukan, melalukan analisis terhadap data tersebut, mencari insight dari data tersebut dan membuat sebuah model data (Machine Learning) untuk menemukan suatu pola yang dapat digunakan untuk melakukan prediksi.

Kenapa Harus Belajar Tentang Data?

Kamu mungkin ingin bertanya "Kenapa saya harus belajar tentang data jika saya tidak ingin berkarir sebagai seorang Data Scientist?". Pertanyaan yang bagus, mari kita jawab pertanyaan ini dengan memberi penjelasan singkat tentang data dan aplikasi data dalam dunia nyata.

Data ada dimana-mana jadi kita tidak perlu pergi jauh-jauh untuk menemukan sebuah data. Data sebenarnya ada banyak di sekitar kita tanpa kita sadari, contohnya tinggi badan dan berat badan termasuk data kuantitatif (angka), warna baju dan merek baju termasuk data kualitatif (non-angka), masih banyak lagi contoh data yang dapat ditemukan dalam kehidupan sehari-hari. Dengan sebuah data kita bisa menyelesaikan banyak masalah seperti masalah kesehatan, bisnis, teknologi dan lainnya.

Berikut ini contoh sederhana aplikasi data dalam dunia nyata. Anggap saja kamu mempunyai sebuah bisnis retail, tentunya kamu ingin mengetahui berapa total penjualan kamu selama sebulan, untuk mengetahui informasi tersebut kamu memerlukan data berupa total penjualan perhari yang akan digabungkan. Dari contoh sederhana ini bisa disimpulkan bahwa kita tidak bisa lepas dari data meskipun kita tidak berkarir sebagai seorang Data Scientist.

Masalah Pemula & Solusinya

Masalah umum yang sering ditemui oleh para pemula sekarang bukanlah kurangnya materi untuk belajar, akan tetapi terlalu banyaknya materi yang tersedia. Ambil contoh saat kita melakukan google search dengan keyord "data science", pasti akan muncul banyak sekali tutorial baik yang gratis maupun berbayar. Hal ini sering kali membuat kita mengalami information paralysis/information overload, yaitu keadaan dimana kita dihadapkan dengan informasi yang sangat banyak sehingga kita tidak bisa mengambil sebuah keputusan.

Saya dulunya juga pernah mengalami masalah ini, yang menyebabkan saya berpindah dari satu artikel ke artikel yang lain, dari satu tutorial ke tutorial yang lain, dari satu teknologi ke teknologi yang lain, pada akhirnya banyak waktu yang terbuang sia-sia dan skill tidak berkembang. Bagi kalian yang suka mengoleksi tutorial dari Udemy tetapi cuma disimpan aja, ngebookmark artikel yang tidak pernah dibaca, usahakan melatih diri untuk komitmen menyelesaikan satu artikel/tutorial dulu baru pindah ke yang lain. Untuk keluar dari lingkaran masalah ini diperlukan disiplin yang kuat apalagi bagi kita yang self-taught/otodidak adalah suatu keharusan dan kurikulum yang terstruktur baik, berbasis goal/tujuan yang realistis, berbasis projek dan tentunya fun!.

Kurikulum

Kurikulum ini dibagi menjadi 5 bagian ditambah dengan bagian bonus yang berisi banyak informasi menarik. Syarat untuk mengikuti kurikulum ini hanya ada 2 yaitu niat dan disiplin. Waktu yang diperlukan untuk menyelesaikan kurikulum ini bervariasi tergantung dari waktu yang dimiliki dan faktor lainnya sehingga baris estimasi selesai pada setiap bagian kurikulum hanyalah sebuah patokan/perkiraan. Kita akan mulai dengan membahas bagian pertama kurikulum ini yaitu Introduction to Data Science.

Introduction to Data Science

⏱️ Durasi: 6 jam
⏱️ Estimasi selesai: 3 hari - 1 minggu

Introduksi yang satu ini bisa dibilang yang paling bagus dalam mengenalkan Data Science dengan bahasa yang mudah dimengerti oleh para pemula. Tutorial ini sama sekali tidak melibatkan matematika yang kompleks atau coding sedikitpun, murni teori, jadi cocok banget buat pemula. Hampir semua hal yang berkaitan dengan Data Science dijelaskan dengan detail, mulai dari definisi Data Science, apa yang dilakukan oleh seorang Data Scientist, teknologi yang digunakan dan masih banyak lagi.

Python for Everybody

📖 Jumlah chapters: 17
⏱️ Estimasi selesai: 1 bulan - 3 bulan

Python for Everybody atau biasa disingkat PY4E merupakan tutorial Python yang materinya berfokus pada bidang data. Kelebihan dari tutorial ini dibanding tutorial Python yang lain adalah:

  1. Materi yang diajarkan terbilang sangat lengkap dan beragam mulai dari dasar komputer, dasar programming, regex, web development, database sampai data visualization.
  2. Dibandingkan dengan kebanyakan tutorial lain yang hanya fokus dengan bahasa Pythonnya sendiri, tutorial ini fokus pada aplikasi Python dalam dunia nyata terutama dalam menyelesaikan masalah-masalah analisis data.

Singkat kata tutorial ini recommended banget. Tutorial ini memenuhi semua kriteria dari tutorial idaman: GRATIS, mudah dimengerti dan materinya lengkap. Tutorial ini juga memiliki versi buku dalam format pdf yang bisa didownload secara gratis sebagai pelengkap materi.

Data Analysis with Python: Zero to Pandas

⏱️ Durasi: +- 12 jam
⏱️ Estimasi selesai: 3 minggu - 2 bulan

Tutorial ini dibagi menjadi 6 bagian. Bagian yang pertama membahas tentang dasar-dasar Python menggunakan Jupyter Notebook sebagai environmentnya/lingkungannya. Bagian kedua membahas Python lebih dalam lagi dan cara-cara bekerja dengan files. Bagian ketiga membahas tentang NumPy, sebuah library Python yang digunakan untuk komputasi scientific. Bagian keempat membahas tentang Pandas, sebuah library Python untuk menganalisa data. Bagian kelima membahas tentang Matplotlib dan Seaborn, dua library Python yang sering digunakan untuk visualisasi data. Pada bagian terakhir kita akan mengerjakan sebuah projek Exploratory Data Analysis (EDA).

Elements of AI

⏱️ Estimasi selesai: 1 bulan - 3 bulan

Elements of AI merupakan tutorial pengenalan AI yang dibuat oleh Reaktor dan University of Helsinki. Tutorial ini dibagi menjadi 2 bagian. Bagian yang pertama adalah Introduction to AI yang akan mengenalkan apa itu AI, apa yang bisa dan tidak bisa dilakukan oleh AI, aplikasi dunia nyata dari AI, apa itu Machine Learning dan masih banyak lagi. Bagian yang kedua adalah Building AI dimana kita akan mempelajari lebih dalam tentang AI dan menyelesaikan puluhan programming exercises dari level beginner sampai advance.

Kaggle Micro Courses

⏱️ Estimasi selesai: 1 bulan - 3 bulan

Saya rasa kalian pasti sudah pernah mendengar tentang platform bernama "Kaggle". Kaggle merupakan sebuah platform yang menyediakan banyak sekali dataset open source untuk segala bidang dan pastinya banyak sekali kompetisi-kompetisi untuk mengasah skill. Kaggle sering kali dianggap sebagai portfolio utama seorang data scientist. Selain itu, ternyata Kaggle juga menyediakan puluhan micro courses/tutorial singkat berbasis projek mulai dari materi Python sampai dengan materi Deep Learning yang bertujuan untuk mempersiapkan kita dalam membuat projek Data Science secara mandiri.

Bonus

Bagian ini berisi materi tambahan yang dibagi menjadi beberapa kategori teknologi, ditambah lagi dengan info channel edukasi youtube, blog Data Science, kompetisi Data Science, grup Data Science dan kursus berbayar.

Python

NumPy

Pandas

Matplotlib

Seaborn

Plotly

Streamlit

OpenCV

Scikit-Learn

Machine Learning

SQL

Microsoft Excel

Matematika

Statistika dan Probabilitas

Channel Youtube

Blog Data Science

Kompetisi Data Science

Grup Data Science

💰 Kursus Data Science Berbayar


Sekian dari artikel ini. Semoga saja artikel ini bisa bermanfaat. Sampai jumpa lagi di artikel saya yang selanjutnya. Teruslah belajar untuk memperbanyak pengalaman karena pengalaman adalah guru terbaik.