Source Code

Jasa Pembuatan Python | Artificial Intelligence Reinforcement Learning Python

Panduan lengkap Pembelajaran Penguatan, dengan Aplikasi Perdagangan Saham dan Periklanan Online

Yang akan Anda pelajari

  • Terapkan metode pembelajaran mesin terawasi berbasis gradien untuk pembelajaran penguatan
  • Memahami pembelajaran penguatan pada tingkat teknis
  • Memahami hubungan antara pembelajaran penguatan dan psikologi
  • Terapkan 17 algoritma pembelajaran penguatan yang berbeda

Persyaratan

  • Kalkulus (turunan)
  • Model Probabilitas / Markov
  • Numpy, Matplotlib
  • Bermanfaat untuk memiliki pengalaman dengan setidaknya beberapa metode pembelajaran mesin yang diawasi
  • Penurunan gradien
  • Keterampilan pemrograman berorientasi objek

Deskripsi

Ketika orang berbicara tentang kecerdasan buatan , mereka biasanya tidak bermaksud pembelajaran mesin yang diawasi dan tidak diawasi .

Tugas-tugas ini cukup sepele dibandingkan dengan apa yang kami pikirkan tentang AI – bermain catur dan Go, mengendarai mobil, dan mengalahkan video game di level manusia super.

Pembelajaran penguatan baru-baru ini menjadi populer untuk melakukan semua itu dan lebih banyak lagi.

Sama seperti pembelajaran mendalam , banyak teori ditemukan pada tahun 70-an dan 80-an tetapi baru belakangan ini kami dapat mengamati secara langsung hasil luar biasa yang mungkin terjadi.

Pada tahun 2016 kami melihat Google AlphaGo mengalahkan Juara dunia dalam Go.

Kami melihat AI memainkan video game seperti Doom dan Super Mario.

Mobil self-driving sudah mulai melaju di jalan nyata dengan pengemudi lain dan bahkan membawa penumpang ( Uber ), semuanya tanpa bantuan manusia.

Jika kedengarannya luar biasa, persiapkan diri Anda untuk masa depan karena hukum percepatan pengembalian menyatakan bahwa kemajuan ini hanya akan terus meningkat secara eksponensial.

Namun pembelajaran penguatan membuka dunia baru. Seperti yang akan Anda pelajari dalam kursus ini, paradigma pembelajaran penguatan sangat baik dari pembelajaran yang diawasi dan tidak diawasi.

Ini mengarah pada wawasan baru dan menakjubkan baik dalam psikologi perilaku dan ilmu saraf. Seperti yang akan Anda pelajari dalam kursus ini, ada banyak proses analogi dalam mengajar agen dan mengajar hewan atau bahkan manusia. Itu adalah hal terdekat yang kita miliki sejauh ini dengan kecerdasan umum buatan yang sebenarnya. Apa yang tercakup dalam kursus ini?

  • Masalah multi-bandit bersenjata dan dilema eksplorasi-eksploitasi
  • Cara menghitung rata-rata dan rata-rata bergerak serta hubungannya dengan penurunan gradien stokastik
  • Proses Keputusan Markov (MDP)
  • Pemrograman Dinamis
  • Montecarlo
  • Pembelajaran Temporal Difference (TD) (Q-Learning dan SARSA)
  • Metode Perkiraan (yaitu cara menyambungkan jaringan saraf yang dalam atau model yang dapat dibedakan lainnya ke dalam algoritme RL Anda)
  • Cara menggunakan OpenAI Gym, tanpa perubahan kode
  • Proyek: Terapkan Q-Learning untuk membuat bot perdagangan saham

Jika Anda siap menghadapi tantangan baru, dan mempelajari tentang teknik AI yang belum pernah Anda lihat sebelumnya dalam pembelajaran mesin terawasi tradisional, pembelajaran mesin tanpa pengawasan, atau bahkan pembelajaran mendalam, maka kursus ini cocok untuk Anda.

Untuk siapa kursus ini:

  • Siapa pun yang ingin belajar tentang kecerdasan buatan, ilmu data, pembelajaran mesin, dan pembelajaran mendalam
  • Baik mahasiswa maupun profesional

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button