Apa yang akan Anda pelajari
-
Pahami algoritma K-Means biasa
-
Pahami dan sebutkan kelemahan K-Means Clustering
-
Pahami algoritma K-Means Clustering yang soft atau tidak jelas
-
Menerapkan Soft K-Means Clustering dalam Kode
-
Pahami Pengelompokan Hirarkis
-
Jelaskan secara algoritme cara kerja Pengelompokan Aglomeratif Hierarki
-
Menerapkan perpustakaan Scipy’s Hierarchical Clustering ke data
-
Pahami cara membaca dendrogram
-
Pahami berbagai metrik jarak yang digunakan dalam pengelompokan
-
Pahami perbedaan antara single linkage, complete linkage, Ward linkage, dan UPGMA
-
Memahami model campuran Gaussian dan bagaimana menggunakannya untuk estimasi kepadatan
-
Tulis kode GMM dengan Python
-
Jelaskan kapan GMM setara dengan K-Means Clustering
-
Jelaskan algoritme maksimalisasi ekspektasi
-
Pahami bagaimana GMM mengatasi beberapa kelemahan K-Means
-
Pahami masalah Kovariansi Singular dan cara mengatasinya
Persyaratan
-
Tahu cara membuat kode dengan Python dan Numpy
-
Pasang Numpy dan Scipy
-
Aritmatika matriks, probabilitas
Deskripsi
Analisis cluster adalah pokok dari pembelajaran mesin dan ilmu data tanpa pengawasan .
Ini sangat berguna untuk data mining dan big data karena secara otomatis menemukan pola dalam data, tanpa perlu label, tidak seperti pembelajaran mesin yang diawasi.
Dalam lingkungan dunia nyata, Anda dapat membayangkan bahwa robot atau kecerdasan buatan tidak selalu memiliki akses ke jawaban yang optimal, atau mungkin tidak ada jawaban benar yang optimal. Anda pasti ingin robot itu bisa menjelajahi dunia sendiri, dan mempelajari banyak hal hanya dengan mencari pola.
Pernahkah Anda bertanya-tanya bagaimana kami mendapatkan data yang kami gunakan dalam algoritme pembelajaran mesin yang diawasi?
Kami sepertinya selalu memiliki CSV atau tabel yang bagus, lengkap dengan X dan Y yang sesuai.
Jika Anda sendiri belum pernah terlibat dalam memperoleh data, Anda mungkin tidak pernah memikirkan hal ini, tetapi seseorang harus membuat data ini!
“Y” itu harus datang dari suatu tempat, dan sering kali melibatkan kerja manual.
Terkadang, Anda tidak memiliki akses ke informasi semacam ini atau informasi tersebut tidak layak atau mahal untuk diperoleh.
Tetapi Anda masih ingin memiliki gambaran tentang struktur datanya. Jika Anda melakukan analisis data, mengotomatiskan pengenalan pola dalam data Anda akan sangat berharga.
Di sinilah pembelajaran mesin tanpa pengawasan berperan.
Dalam kursus ini pertama-tama kita akan berbicara tentang pengelompokan. Di sinilah alih-alih melatih label, kami mencoba membuat label sendiri! Kami akan melakukan ini dengan mengelompokkan data yang mirip.
Ada 2 metode clustering yang akan kita bicarakan: k-means clustering dan hierarchical clustering .
Selanjutnya, karena dalam pembelajaran mesin kita suka berbicara tentang distribusi probabilitas, kita akan membahas model campuran Gaussian dan estimasi kepadatan kernel , di mana kita berbicara tentang cara “mempelajari” distribusi probabilitas sekumpulan data.
Satu fakta menarik adalah bahwa dalam kondisi tertentu, model campuran Gaussian dan pengelompokan k-means sama persis! Kami akan membuktikan bagaimana ini terjadi.
Semua algoritme yang akan kita bicarakan dalam kursus ini adalah pokok dalam pembelajaran mesin dan ilmu data, jadi jika Anda ingin tahu cara menemukan pola secara otomatis dalam data Anda dengan penggalian data dan ekstraksi pola, tanpa memerlukan seseorang untuk melakukan pekerjaan manual ke beri label data itu, maka kursus ini cocok untuk Anda.
- Pelajar dan profesional yang tertarik dengan pembelajaran mesin dan ilmu data
- Orang yang menginginkan pengenalan tentang pembelajaran mesin tanpa pengawasan dan analisis cluster
- Orang yang ingin tahu cara menulis kode pengelompokan mereka sendiri
- Profesional yang tertarik dengan kumpulan data besar penambangan data untuk mencari pola secara otomatis