Apa yang akan Anda pelajari?
-
Analisis dan Pemahaman Data
-
Teknik Pra-pemrosesan Data
-
Penandaan POS dan Lemmatisasi
-
Awan Kata
-
Vektorisasi TF-IDF
-
Pembuatan Model untuk Analisis Sentimen
-
Metrik Klasifikasi
-
Evaluasi Model
-
Menjalankan model di Server Streamlit lokal
-
Mendorong buku catatan dan file proyek Anda ke repositori GitHub
-
Menyebarkan proyek di Heroku Cloud Platform
Persyaratan
-
Pengetahuan yang sangat dasar tentang Python dan Anaconda
-
Keakraban dengan Github
Keterangan
Dalam kursus ini saya akan membahas, bagaimana mengembangkan model Analisis Sentimen untuk mengkategorikan tweet sebagai Positif atau Negatif menggunakan teknik NLP dan Model Pembelajaran Mesin. Ini adalah proyek langsung di mana saya akan mengajari Anda proses langkah demi langkah dalam membuat dan mengevaluasi model pembelajaran mesin dan akhirnya menerapkan yang sama di platform Cloud untuk memungkinkan pelanggan Anda berinteraksi dengan model Anda melalui antarmuka pengguna.
Kursus ini akan memandu Anda melalui eksplorasi dan pemahaman data awal, analisis data, pra-pemrosesan data, persiapan data, pembuatan model, evaluasi, dan teknik penerapan. Kami akan mengeksplorasi konsep NLP dan kemudian menggunakan beberapa algoritme ML untuk membuat model kami dan akhirnya fokus ke salah satu yang berkinerja terbaik pada kumpulan data yang diberikan.
Pada akhirnya kita akan belajar membuat Antarmuka Pengguna untuk berinteraksi dengan model yang kita buat dan akhirnya menerapkan yang sama di Cloud.
Saya telah membagi dan memisahkan seluruh kursus dalam Tugas di bawah ini, untuk memudahkan pemahaman tentang apa yang akan dibahas.
Tugas 1: Menginstal Paket.
Tugas 2: Mengimpor Perpustakaan.
Tugas 3: Memuat data dari sumber.
Tugas 4: Memahami data
Tugas 5: Mempersiapkan data untuk pra-pemrosesan
Tugas 6: Ikhtisar langkah-langkah pra-pemrosesan
Tugas 7: Fungsi Pra-pemrosesan Kustom
Tugas 8 : Tentang penandaan POS dan Lemmatization
Tugas 9 : Tindakan penandaan dan lemmatisasi POS.
Tugas 10 : Membuat kumpulan kata dari tweet positif dan negatif.
Tugas 11: Mengidentifikasi kumpulan kata yang paling sering dalam kumpulan data untuk kasus positif dan negatif.
Tugas 12: Melatih Test Split
Tugas 13 : Tentang TF-IDF Vectorizer
Tugas 14 : TF-IDF Vectorizer beraksi
Tugas 15 : Tentang Matriks Kebingungan
Tugas 16 : Tentang Laporan Klasifikasi
Tugas 17 : Tentang AUC-ROC
Tugas 18 : Membuat fungsi Evaluasi Model umum
Tugas 19 : Memeriksa kinerja model di berbagai model
Tugas 20 : Inferensi Akhir dan menyimpan model
Tugas 21 : Menguji model pada kumpulan data yang tidak diketahui
Tugas 22 : Menguji model pada kumpulan data yang tidak diketahui – Opsi Excel
Tugas 23 : Apa itu Streamlit dan langkah-langkah Instalasi.
Tugas 24 : Membuat antarmuka pengguna untuk berinteraksi dengan model yang kita buat.
Tugas 25 : Menjalankan notebook Anda di Streamlit Server di mesin lokal Anda.
Tugas 26 : Mendorong proyek Anda ke repositori GitHub.
Tugas 27 : Penerapan Proyek di Platform Heroku secara gratis.
Analisis Data, teknik NLP, Model Building and Deployment adalah salah satu keterampilan yang paling dituntut di abad ke-21. Ikuti kursusnya sekarang, dan dapatkan pemahaman yang lebih kuat tentang teknik NLP, pembelajaran mesin.
Untuk siapa kursus ini:
- Pelajar dan profesional yang ingin mempelajari Analisis Data, teknik NLP, Persiapan Data untuk Pembuatan Model, Evaluasi, dan Penerapan Model di Cloud.
- Pelajar dan profesional yang ingin berinteraksi secara visual dengan model yang mereka buat.
- Profesional yang tahu cara membuat model tetapi ingin menerapkan model mereka di platform cloud.