Kursus/Jasa Machine Learning | Reinforcement Learning Beginner to Master – AI in Python
Bangun Agen Kecerdasan Buatan (AI) Menggunakan Deep Reinforcement Learning dan PyTorch: A2C, REINFORCE, DQN, dll.
Yang akan Anda pelajari
-
Pahami paradigma Pembelajaran Penguatan dan tugas-tugas yang paling sesuai untuk diselesaikan.
-
Memahami proses penyelesaian tugas kognitif menggunakan Reinforcement Learning
-
Pahami berbagai pendekatan untuk menyelesaikan tugas menggunakan Reinforcement Learning dan pilih yang paling sesuai
-
Menerapkan algoritma Reinforcement Learning sepenuhnya dari awal
-
Memahami secara mendasar proses pembelajaran untuk setiap algoritma
-
Debug dan perluas algoritma yang disajikan
-
Memahami dan menerapkan algoritma baru dari makalah penelitian
Deskripsi
Ini adalah kursus Reinforcement Learning terlengkap. Di dalamnya Anda akan mempelajari dasar-dasar Reinforcement Learning, salah satu dari tiga paradigma kecerdasan buatan modern. Anda akan menerapkan algoritma adaptif dari awal yang menyelesaikan tugas kontrol berdasarkan pengalaman. Anda juga akan belajar menggabungkan algoritme ini dengan teknik Pembelajaran Mendalam dan jaringan saraf, sehingga memunculkan cabang yang dikenal sebagai Pembelajaran Penguatan Mendalam.
Kursus ini akan memberi Anda dasar yang Anda perlukan untuk dapat memahami algoritma baru yang muncul. Ini juga akan mempersiapkan Anda untuk kursus berikutnya dalam seri ini, di mana kita akan mempelajari lebih dalam berbagai cabang Pembelajaran Penguatan dan melihat beberapa algoritma tingkat lanjut yang ada.
Kursus ini difokuskan pada pengembangan keterampilan praktis. Oleh karena itu, setelah mempelajari konsep terpenting dari setiap kelompok metode, kami akan mengimplementasikan satu atau lebih algoritmenya di notebook jupyter, dari awal.
Kursus ini dibagi menjadi tiga bagian dan mencakup topik-topik berikut:
Bagian 1 (Metode tabel):
– Proses pengambilan keputusan Markov
– Pemrograman dinamis
– Metode Monte Carlo
– Metode perbedaan waktu (SARSA, Q-Learning)
– Bootstrap N-langkah
Bagian 2 (Ruang berkelanjutan):
– Agregasi
– Pengodean Ubin
Bagian 3 (Pembelajaran Penguatan Mendalam):
– SARS yang dalam
– Pembelajaran Q Mendalam
– MEMPERKUAT
– Keuntungan Aktor-Kritik / A2C (Metode Aktor-Kritikus / A2C)
Untuk siapa kursus ini:
- Pengembang yang ingin mendapatkan pekerjaan di Machine Learning
- Ilmuwan/analis data dan praktisi ML yang ingin memperluas pengetahuan mereka.
- Peneliti/cendekiawan yang ingin meningkatkan keterampilan pengkodean praktis mereka.