Home / Data Science / Training Pelatihan Kursus Jasa Python | Artificial Intelligence-OCR Text-Translation Menggunakan Python
Training Pelatihan Kursus Jasa Python | Artificial Intelligence-OCR Text-Translation Menggunakan Python

Training Pelatihan Kursus Jasa Python | Artificial Intelligence-OCR Text-Translation Menggunakan Python

Bangun pengenalan Karakter Optik dan alat terjemahan teks dari awal, menggunakan bahasa pemrograman python

Apa yang akan Anda pelajari

  • Optical Character Recognition dengan Tesseract Library, Image Recognition menggunakan Keras, Object Recognition menggunakan MobileNet SSD, Mask R-CNN, 

Persyaratan

  • Komputer konfigurasi yang layak (lebih disukai Windows) dan antusiasme untuk terjun ke dunia OCR, Pengenalan Gambar dan Objek menggunakan Python

Deskripsi

Image Recognition, Object Detection, Object Recognition dan juga Optical Character Recognition adalah beberapa aplikasi Computer Vision yang paling banyak digunakan.

Dengan menggunakan teknik ini, komputer akan dapat mengenali dan mengklasifikasikan baik keseluruhan gambar, atau beberapa objek di dalam satu gambar yang memprediksi kelas objek dengan persentase skor akurasi. Menggunakan OCR, itu juga dapat mengenali dan mengubah teks dalam gambar ke format yang dapat dibaca mesin seperti teks atau dokumen.

Deteksi Objek dan Pengenalan Objek banyak digunakan dalam banyak aplikasi sederhana dan juga aplikasi kompleks seperti mobil self-driving.

Kursus ini akan menjadi permulaan cepat bagi orang-orang yang ingin mendalami Pengenalan Karakter Optik, Pengenalan Gambar, dan Deteksi Objek menggunakan Python tanpa harus berurusan dengan semua kerumitan dan matematika yang terkait dengan proses Pembelajaran Mendalam yang khas.

Sekarang mari kita lihat daftar topik menarik yang termasuk dalam kursus ini.

Pada awalnya kita akan memiliki sesi pengantar teori tentang teknologi Optical Character Recognition.

Setelah itu, kami siap untuk melanjutkan dengan mempersiapkan komputer kami untuk pengkodean python dengan mengunduh dan menginstal paket anaconda dan akan memeriksa dan melihat apakah semuanya sudah terpasang dengan baik.

Sebagian besar dari Anda mungkin tidak berasal dari latar belakang pemrograman berbasis python. Beberapa sesi dan contoh berikutnya akan membantu Anda mendapatkan keterampilan dasar pemrograman python untuk melanjutkan sesi yang disertakan dalam kursus ini. Topiknya meliputi tugas Python, kontrol aliran, fungsi, dan struktur data.

Kemudian kami akan menginstal dependensi dan pustaka yang kami perlukan untuk melakukan Pengenalan Karakter Optik. Kami menggunakan Perpustakaan Tesseract untuk melakukan OCR. Pertama kita akan menginstal Library dan kemudian mengikat python-nya. Kami juga akan menginstal OpenCV, yang merupakan pustaka Open Source Computer Vision dengan Python.

Kami juga akan menginstal perpustakaan Pillow, yang merupakan Perpustakaan Gambar Python. Kemudian kita akan memiliki pengantar langkah-langkah yang terlibat dalam Pengenalan Karakter Optik dan kemudian akan melanjutkan dengan pengkodean dan penerapan program OCR. Kami akan menggunakan beberapa contoh gambar untuk melakukan pengujian Pengenalan Karakter dan akan memverifikasi hasilnya.

Kemudian kita akan memiliki pengantar Jaringan Neural Konvolusional, yang akan kita gunakan untuk melakukan Pengenalan Gambar. Di sini kita akan mengklasifikasikan gambar penuh berdasarkan objek utama tunggal di dalamnya.

Kami kemudian akan melanjutkan dengan menginstal Perpustakaan Keras yang akan kami gunakan untuk melakukan pengenalan Gambar. Kami akan menggunakan Model bawaan terlatih yang disertakan dalam Keras. Kode dasar python juga disediakan di dokumentasi Keras.

Pada awalnya Kami akan menggunakan arsitektur model terlatih yang populer yang disebut VGGNet. kita akan mengadakan sesi pengantar tentang arsitektur VGGNet. Kemudian kami akan melanjutkan dengan menggunakan Model VGGNet 16 terlatih yang disertakan dalam keras untuk melakukan Pengenalan Gambar dan klasifikasi. Kami akan mencoba dengan beberapa gambar contoh untuk memeriksa prediksi. Kemudian akan beralih ke Model VGGNet 19 yang lebih dalam termasuk dalam keras untuk melakukan Pengenalan Gambar dan klasifikasi.

Kemudian kita akan mencoba model terlatih ResNet yang disertakan dengan pustaka Keras. Kami akan memasukkan model ke dalam kode dan kemudian kami akan mencoba dengan beberapa gambar contoh untuk memeriksa prediksi.

Dan setelah itu kita akan mencoba model pra-terlatih Inception. Kami juga akan memasukkan model dalam kode dan kemudian kami akan mencoba dengan beberapa gambar contoh untuk memeriksa prediksi. Kemudian akan melanjutkan dengan model terlatih Xception. Di sini juga, kami akan memasukkan model ke dalam kode dan kemudian kami akan mencoba dengan beberapa gambar contoh.

Dan itulah model-model terlatih Pengenalan Gambar, yang hanya bisa memberi label dan mengklasifikasikan gambar lengkap berdasarkan objek utama di dalamnya. Sekarang kita akan melanjutkan dengan Pengenalan Objek di mana kita dapat mendeteksi dan memberi label beberapa objek dalam satu gambar.

Pada awalnya kita akan memperkenalkan MobileNet-SSD Pre-training Model, yaitu detektor tembakan tunggal yang mampu mendeteksi banyak objek dalam satu adegan. Kami juga akan berdiskusi singkat tentang kumpulan data yang digunakan untuk melatih model ini.

Nanti kami akan menerapkan Model Pra-terlatih MobileNet-SSD dalam kode kami dan akan mendapatkan prediksi dan koordinat kotak pembatas untuk setiap objek yang terdeteksi. Kami akan menggambar kotak pembatas di sekitar objek pada gambar dan menulis label bersama dengan nilai kepercayaan.

Kemudian kita akan melanjutkan dengan deteksi objek dari video langsung. Kami akan mengalirkan video langsung waktu nyata dari webcam komputer dan akan mencoba mendeteksi objek darinya. Kami akan menggambar persegi panjang di sekitar setiap objek yang terdeteksi dalam video langsung bersama dengan label dan keyakinan.

Pada sesi berikutnya, kita akan melanjutkan dengan deteksi objek dari video yang telah disimpan sebelumnya. Kami akan mengalirkan video yang disimpan dari folder kami dan akan mencoba mendeteksi objek darinya. Kami akan menggambar persegi panjang di sekitar setiap objek yang terdeteksi bersama dengan label dan kepercayaan.

Nanti kita akan melanjutkan dengan Model Pra-terlatih Mask-RCNN. Dalam model sebelumnya, kita hanya bisa mendapatkan kotak pembatas di sekitar objek, tetapi di Mask-RCNN, kita bisa mendapatkan koordinat kotak serta mask di atas bentuk objek yang terdeteksi. Kami akan memiliki pengantar tentang model ini dan detailnya.

Nanti kita akan menerapkan Model Pra-terlatih Mask-RCNN dalam kode kita dan sebagai langkah pertama kita akan mendapatkan prediksi dan koordinat kotak pembatas untuk setiap objek yang terdeteksi. Kami akan menggambar kotak pembatas di sekitar objek pada gambar dan menulis label bersama dengan nilai kepercayaan.

Nanti kita akan mendapatkan kembali topeng untuk setiap objek yang diprediksi. Kami akan memproses data itu dan menggunakannya untuk menggambar topeng multi-warna transparan di setiap objek yang terdeteksi dan menulis label bersama dengan nilai kepercayaan.

Kemudian kita akan melanjutkan dengan deteksi objek dari video langsung menggunakan Mask-RCNN. Kami akan mengalirkan video langsung waktu nyata dari webcam komputer dan akan mencoba mendeteksi objek darinya. Kami akan menggambar topeng di sekeliling setiap objek yang terdeteksi dalam video langsung bersama dengan label dan keyakinan.

Dan seperti yang kami lakukan untuk model sebelumnya, kami akan melanjutkan dengan deteksi objek dari video yang disimpan sebelumnya menggunakan Mask-RCNN. Kami akan mengalirkan video yang disimpan dari folder kami dan akan mencoba mendeteksi objek darinya. Kami akan menggambar topeng berwarna untuk objek yang terdeteksi bersama dengan label dan kepercayaan.

Mask-RCNN sangat akurat dengan daftar kelas yang luas tetapi akan sangat lambat dalam memproses gambar menggunakan komputer berbasis CPU berdaya rendah. MobileNet-SSD cepat tetapi kurang akurat dan jumlah kelasnya rendah. Kami membutuhkan perpaduan sempurna antara kecepatan dan akurasi yang akan membawa kami ke Deteksi dan Pengenalan Objek menggunakan model terlatih YOLO. Kita akan melihat gambaran umum tentang model yolo di sesi berikutnya dan kemudian kita akan menerapkan deteksi objek yolo dari satu gambar.

Dan menggunakan itu sebagai basis, kami akan mencoba model yolo untuk deteksi objek dari video webcam real time dan kami akan memeriksa kinerjanya. Nanti kami akan menggunakannya untuk pengenalan objek dari file video yang telah disimpan sebelumnya.

Untuk lebih meningkatkan kecepatan proses frame, kami akan menggunakan model yang disebut Tiny YOLO yang merupakan versi ringan dari model yolo sebenarnya. Kami akan menggunakan yolo kecil pada awalnya untuk video yang telah disimpan sebelumnya dan akan menganalisis keakuratan serta kecepatan dan kemudian kami akan mencoba hal yang sama untuk video waktu nyata dari webcam dan melihat perbedaan kinerja dibandingkan dengan yolo yang sebenarnya.

Itu semua tentang topik yang saat ini termasuk dalam kursus cepat ini. Kode, gambar dan pustaka yang digunakan dalam kursus ini telah diunggah dan dibagikan dalam sebuah folder. Saya akan menyertakan tautan untuk mengunduhnya di sesi terakhir atau bagian sumber daya dari kursus ini. Anda bebas menggunakan kode dalam proyek Anda tanpa pertanyaan.

Untuk siapa kursus ini:

  • Pemula atau yang ingin memulai dengan OCR berbasis Python, Pengenalan Gambar, dan Pengenalan Objek

About Jogja Multimedia

Leave a Reply

Your email address will not be published. Required fields are marked *

*

Scroll To Top