Apa yang akan Anda pelajari?
-
Perpustakaan: Hugging Face, NLTK, SpaCy, Keras, Sci-kit Learn, Tensorflow, Pytorch, Twint
-
Linguistics Foundation Untuk Membantu Mempelajari Konsep NLP
-
Pembelajaran Mendalam: Jaringan Syaraf Tiruan, RNN, Teori LSTM & Proyek Praktis
-
Kikis Tweet Tanpa Batas Menggunakan Alat Intelijen Sumber Terbuka
-
Pemahaman Pembacaan Mesin: Buat Sistem Penjawab Pertanyaan dengan SQuAD
-
Tidak Ada Pemasangan Anaconda atau Jupyter yang Membosankan: Gunakan Notebook Berbasis Cloud Google Colab Modern untuk menggunakan Python
-
Cara Membangun Chatbots AI Generatif
-
Buat Sistem Rekomendasi Netflix Dengan Word2Vec
-
Lakukan Analisis Sentimen pada Ulasan Game Steam
-
Ubah Ucapan Menjadi Teks
-
Teknik Pemodelan Pembelajaran Mesin
-
Properti Markov – Teori & Praktik
-
Bagian Python Untuk Pemula Opsional
-
Cosinus-Kemiripan & Vektor
-
Penyematan Kata: Topik Favorit Saya Diajarkan Secara Mendalam
-
Pengenalan suara
-
Detektor Berita Palsu LSTM
-
Sintaks Tata Bahasa Bebas Konteks
-
Mengikis Wikipedia & Membuat Peringkasan Artikel
Persyaratan
-
Tidak diperlukan pengetahuan pemrograman sebelumnya. Materi perlahan menjelaskan sintaks python saat Anda membuat kode sendirian dengan kami.
-
Baru mengenal Python: Anda mendapatkan penjelasan kode saat Anda membuat kode bersama saya tetapi tidak hanya itu – slide teori menjelaskan konsep untuk membantu Anda memahami apa yang terjadi di balik kode.
-
Tidak diperlukan pengetahuan ilmu data: kuliah mengajarkan cara bekerja dengan data dan konsep pemodelan utama.
-
Tidak diperlukan pengetahuan NLP. Konsep linguistik diajarkan untuk memberikan dasar yang kuat dari NLP bahkan sebelum Anda masuk ke pengkodean praktis. Ini membantu Anda memahami teknik pemodelan NLP dan konsep pembersihan dengan lebih baik.
Keterangan
Kursus ini membawa Anda dari tingkat pemula untuk dapat memahami konsep NLP, teori linguistik, dan kemudian mempraktikkan teori-teori dasar ini menggunakan Python – dengan contoh yang sangat sederhana saat Anda membuat kode bersama saya.
Dapatkan pengalaman melakukan alur kerja dunia nyata penuh dari Mengumpulkan Data Anda sendiri hingga Analisis Sentimen NLP menggunakan Kumpulan Data Besar dengan lebih dari 50.000 Tweet.
- Pengumpulan data: Kikis Twitter menggunakan: OSINT – Alat Intelijen Sumber Terbuka: Kumpulkan data teks menggunakan teknik dunia nyata. Di dunia nyata, dalam banyak kasus Anda harus membuat kumpulan data Anda sendiri; yaitu sumber data Anda alih-alih mengunduh file yang bersih dan siap pakai secara online
- Gunakan Python untuk mencari tweet yang relevan untuk studi Anda dan NLP untuk menganalisis sentimen.
Sintaks Bahasa: Sebagian besar kursus NLP mengabaikan domain inti Linguistik. Kursus ini menjelaskan dasar-dasar pohon Sintaks & Parse Bahasa – dasar bagaimana sebuah mesin dapat menginterpretasikan struktur kalimat.
Baru mengenal Python: Jika Anda baru mengenal Python atau pemrograman komputer apa pun, instruksi kursus memudahkan Anda membuat kode bersama dengan saya. Saya menjelaskan kode baris demi baris.
Tanpa Pemasangan, kita langsung ke pengkodean – Kode menggunakan Google Colab – untuk mengetahui apa yang digunakan di dunia Ilmu Data 2021!
Langkah perlahan membawa Anda secara bertahap dari dasar-dasar dasar NLP ini untuk dapat memahami teori-teori Pembelajaran Mendalam Matematika & Linguistik (Bahasa Inggris, Non-Matematika) .
Pemrosesan Bahasa Alami
- Linguistik & Semantik – pelajari teori latar belakang bahasa alami untuk lebih memahami aplikasi Ilmu Komputer
- Data Pra-pemrosesan (pembersihan)
- Regex, Tokenization, Stemming, Lemmatization
- Pengenalan Nama Entitas (NER)
- Penandaan Bagian-of-Speech
Pasukan
SQuAD – Kumpulan Data Jawaban Pertanyaan Stanford. Latih Model T&J Anda pada kumpulan data SQuAD yang mengagumkan ini.
Perpustakaan:
- NLTK
- Sci-kit Learn
- Hugging Face
- Tensorflow
- Pytorch
- SpaCy
- Twint
Topik yang diuraikan di bawah ini diajarkan menggunakan proyek Python praktis !
- Pohon Parse
- Rantai Markov
- Klasifikasi Teks & Analisis Sentimen
- Pembuat Nama Perusahaan
- Analisis Sentimen Tanpa Pengawasan
- Pemodelan Topik
- Penyematan Kata dengan Model Pembelajaran Mendalam
- Menjawab Pertanyaan Domain Tertutup (Seperti mengajukan pertanyaan tentang banyak topik berbeda, dari Beyonce hingga Masakan Iran)
- LSTM menggunakan TensorFlow, Model Urutan Keras
- Pengenalan suara
- Konversikan Ucapan ke Teks
Jaringan Saraf
- Ini diajarkan dari prinsip pertama – membandingkan Neuron Biologis di Otak Manusia dengan Neuron Buatan.
- Proyek praktis: Analisis Sentimen Ulasan Steam
Word Embedding : Topik ini dibahas secara rinci, mirip dengan struktur program sarjana yang mencakup teori & contoh praktis:
- TF-IDF
- Word2Vec
- Satu Pengodean
Pembelajaran Mendalam
- Jaringan Saraf Berulang
- LSTM
- Perkenalkan memori jangka pendek panjang dan arsitektur jaringan saraf berulang yang digunakan di bidang pembelajaran mendalam.
- Bangun model menggunakan LSTM
Untuk siapa kursus ini:
- Siapa pun yang ingin tahu tentang ilmu data & NLP
- Mereka yang berkecimpung di dunia Bisnis & Pemasaran – belajar menggunakan NLP untuk mendapatkan wawasan tentang pelanggan & produk. Dapat membantu saat wawancara & promosi pekerjaan.
- Jika Anda berniat untuk mendaftar di kursus NLP/Ilmu Data tetapi masih pemula, selesaikan kursus ini sebelumnya untuk menghindari tersesat di kelas karena akan tampak berlebihan jika teman sekelas sudah memiliki dasar dalam Python atau Ilmu Data.