Home / Data Science / Training Pelatihan Kursus Jasa Machine Learning | Pemrosesan Bahasa Alami Pembelajaran Mesin Python
Training Pelatihan Kursus Jasa Machine Learning | Pemrosesan Bahasa Alami Pembelajaran Mesin Python

Training Pelatihan Kursus Jasa Machine Learning | Pemrosesan Bahasa Alami Pembelajaran Mesin Python

Pelajari dasar-dasar Pemrosesan Bahasa Alami dan cara menerapkan Pembelajaran Mesin dengan Python untuk menyelesaikan masalah NLP

Apa yang akan Anda pelajari?

  • Dasar-dasar Pemrosesan Bahasa Alami
  • Tokenisasi, Stemming dan Lemmatization
  • Pengenalan Entitas Bernama dan Penandaan Bagian dari Ucapan
  • Hitung Vektorisasi dan Vektorisasi TF-IDF
  • Meningkatkan kinerja dengan N-gram
  • Cara menggunakan NLTK, SpaCy dan Scikit-Belajar untuk memecahkan Masalah NLP
  • Pembersihan Data dan Pra-Pemrosesan Teks
  • Analisis Sentimen menggunakan Pembelajaran Mesin dengan Python
  • Klasifikasi Teks menggunakan Pembelajaran Mesin dengan Python
  • Mengintegrasikan dengan API Twitter

Persyaratan

  • Hanya beberapa pengalaman pengkodean dengan bahasa pemrograman apa pun
  • Anda tidak memerlukan pengetahuan sebelumnya tentang NLP atau Python

Keterangan

Kursus ini dirancang dengan cermat bagi Anda untuk mempelajari dasar-dasar Pemrosesan Bahasa Alami dan kemudian maju secara bertahap dan untuk memecahkan masalah NLP yang kompleks menggunakan Pembelajaran Mesin. Semua yang diajarkan dalam kursus ini sepenuhnya langsung. Jadi, Anda akan dapat mempelajari berbagai hal dengan melakukannya sendiri.

Anda tidak memerlukan pengalaman sebelumnya dalam Pemrosesan Bahasa Alami, Pembelajaran Mesin, atau bahkan Python. Tetapi Anda harus nyaman dengan pemrograman, dan harus terbiasa dengan setidaknya satu bahasa pemrograman. Python sejauh ini merupakan salah satu bahasa pemrograman terbaik untuk mengatasi masalah Machine Learning dan juga berlaku di sini. Jika Anda baru mengenal Python, jangan khawatir, saya akan menjelaskan apa yang perlu Anda ketahui, sebelum menggunakannya.

Dalam kursus ini, kami menggunakan Google Colab untuk menjalankan kode kami. Jadi, Anda tidak perlu menginstal atau mengkonfigurasi apa pun di mesin Anda. Tidak masalah apa OS atau spesifikasi perangkat keras Anda, selama Anda memiliki akses ke Internet. Tetapi jika Anda tertarik, kode yang sama dapat dijalankan di Notebook Jupyter, yang diinstal di mesin Anda.

Pertama kita akan mengeksplorasi konsep dasar Natural Language Processing, seperti tokenization, stemming dan lemmatization menggunakan NLTK. Anda akan mempelajari lebih dari satu cara untuk menyelesaikan hal-hal ini, sehingga Anda dapat memahami pro dan kontra dari berbagai pendekatan. Kemudian kita akan mempelajari beberapa teknik pra-pemrosesan untuk menghilangkan stop-word, spasi, tanda baca, simbol, baris baru, dll.

Selanjutnya kita akan pindah ke SpaCy – perpustakaan NLP canggih yang banyak digunakan di industri. Kami akan menjelajahi saluran NLP, dan konsep yang lebih maju seperti Pengenalan Entitas Bernama dan Ketergantungan Sintaksis. Teknik ini memungkinkan kode Anda untuk secara otomatis memahami konsep seperti uang, waktu, perusahaan, produk, lokasi, dan banyak lagi hanya dengan menganalisis informasi teks.

Di sana kami akan membahas penandaan Part-of-Speech juga, di mana kode Anda akan dapat secara otomatis menetapkan kata-kata dalam teks ke bagian ucapan yang sesuai, seperti kata benda, kata kerja, kata keterangan dan kata sifat, bagian penting dari membangun sistem bahasa yang cerdas .

Setelah itu, Anda akan belajar bagaimana mengubah teks menjadi format yang dapat dimengerti oleh komputer. Proses ini disebut vektorisasi. Ada lebih dari satu cara untuk melakukan ini, dan Anda akan mempelajari dua mekanisme yang paling umum. Hitung vektorisasi dan vektorisasi TF-IDF.

Selanjutnya, kita akan pindah ke Klasifikasi Teks, di mana kita akan mulai menggunakan Pembelajaran Mesin untuk Pemrosesan Bahasa Alami. Kami akan membangun model yang berfungsi penuh untuk mengklasifikasikan ulasan film IMDb. Di sana Anda akan belajar cara melakukan pembersihan data, pra-pemrosesan, rekayasa fitur, pelatihan dan pengujian model. Kami akan mencoba beberapa algoritme pembelajaran mesin yang berbeda dari perpustakaan scikit-learn, seperti Logistic Regression, Naive Bayes, dan Linear SVC, dan kami akan mengeksplorasi cara meningkatkan kinerja pada setiap kasus. Anda akan dapat menggunakan pembelajaran dari bagian ini untuk mengatasi masalah NLP dunia nyata, seperti klasifikasi ulasan atau deteksi spam.

Kemudian kita akan beralih ke salah satu area Pemrosesan Bahasa Alami yang paling menuntut, yaitu Analisis Sentimen. Pertama kita akan mengeksplorasi cara menggunakan beberapa alat analisis sentimen bawaan seperti TextBlob dan VADER. Kemudian kita akan mulai membangun Penganalisis Sentimen kita sendiri menggunakan Regresi Logistik dan Naive Bayes. Di sana kita akan melalui semua langkah yang diperlukan untuk membangun penganalisis sentimen dari awal, termasuk pra-pemrosesan, rekayasa fitur, pelatihan, dan pengujian.

Terakhir, kita akan menyelesaikan kursus ini dengan mempelajari cara mengintegrasikan API Twitter untuk menarik data Twitter. Twitter sejauh ini merupakan media sosial terkuat dalam hal data teks. Beberapa investor, bank, dan hedge fund sudah menggunakan data Twitter untuk memahami sentimen pasar. Jadi mengapa tidak mempelajari cara menggunakan sumber daya yang berharga ini, sebagai sumber data untuk masalah NLP Anda.

Pemrosesan Bahasa Alami menjadi salah satu keahlian yang sangat menuntut dalam industri teknologi, dan kursus ini akan membantu Anda memulai perjalanan NLP Anda.

Untuk siapa kursus ini:

  • Pengembang yang masuk ke Pembelajaran Mesin dan Ilmu Data
  • Insinyur Pembelajaran Mesin tertarik untuk menjelajahi domain NLP
  • Siswa yang tertarik untuk belajar NLP
  • Siapa pun yang tertarik untuk memecahkan masalah NLP

About Jogja Multimedia

Leave a Reply

Your email address will not be published. Required fields are marked *

*

Scroll To Top