Yang akan Anda pelajari
-
Anda akan dapat mengimplementasikan proyek ilmu data ujung ke ujung mulai dari data hingga tingkat pengetahuan
-
Anda akan menerapkan pengetahuan ilmu data Anda pada masalah apa pun di domain mana pun, atau Anda akan memahami jika itu tidak dapat diterapkan
Deskripsi
Kursus ini dimulai dengan pendekatan top-down terhadap proyek ilmu data. Langkah pertama mencakup teknik manajemen proyek ilmu data dan kami mengikuti metodologi CRISP-DM dengan 6 langkah di bawah ini:
Pemahaman Bisnis : Kami membahas jenis masalah dan proses bisnis dalam kehidupan nyata
Pemahaman Data: Kami membahas tipe data dan masalah data. Kami juga mencoba memvisualisasikan data untuk ditemukan.
Pemrosesan Awal Data: Kami membahas masalah klasik pada data dan juga menangani masalah seperti data yang berisik atau kotor dan nilai yang hilang. Pemfilteran baris atau kolom , integrasi data dengan penggabungan dan gabungan . Kami membahas transformasi data seperti diskritisasi, normalisasi, atau pivoting .
Pembelajaran Mesin: kami membahas algoritma klasifikasi seperti Naive Bayes, Decision Trees, Logistic Regression atau K-NN. Kami juga membahas algoritma prediksi/regresi seperti regresi linier, regresi polinomial, atau regresi pohon keputusan. Kami juga membahas masalah pembelajaran tanpa pengawasan seperti pengelompokan dan pembelajaran aturan asosiasi dengan k-means atau pengelompokan hierarki, dan algoritma apriori. Akhirnya kami membahas teknik ansambel di Knime.
Evaluasi: Pada langkah terakhir ilmu data, kami mempelajari metrik keberhasilan melalui Confusion Matrix, Precision, Recall, Sensitivitas, Spesifisitas untuk klasifikasi; kemurnian, randindex untuk Clustering dan rmse, rmae, mse, mae untuk masalah Regresi / Prediksi dengan Knime.
Kami juga memiliki kelas bonus untuk jaringan saraf tiruan dan pembelajaran mendalam tentang masalah pemrosesan gambar.
Untuk siapa kursus ini:
- jika Anda ingin memonetisasi data Anda
- jika Anda ingin mengaktifkan data Anda
- jika Anda ingin membuat sistem cerdas
- jika Anda penasaran dengan ilmu data atau pembelajaran mesin