Şu yazıyı okuyorsunuz: 2022’de Takviyeli Öğrenmeyi Öğrenmek için En İyi Kaynaklar
Takviyeli öğrenme, istenen davranışların ödüllendirilmesine ve istenmeyen davranışların cezalandırılmasına dayanan bir makine öğrenimi eğitim yöntemidir. Takviyeli öğrenme aracısı, çevresini algılayıp yorumlayabilir, harekete geçebilir ve deneme yanılma yoluyla öğrenebilir. Takviyeli öğrenme büyük ölçüde otonom sürüş, otomatik veri merkezi soğutma, öneri motorları, kişiselleştirilmiş sohbet robotları, hisse senedi alım satımı vb. alanlarda kullanılır.
Burada, 2022’de pekiştirmeli öğrenime yönelik en önemli kaynaklara bakıyoruz:
David Silver’dan RL kursu
DeepMind araştırma lideri David Silver’ın University College London’da öğretilen pekiştirmeli öğrenim kursu, on YouTube videosunda sunuluyor. Videolar, Takviyeli Öğrenmeye Giriş, Markov Karar Süreçleri, Dinamik Programlama Kullanarak Planlama, Modelden Bağımsız Tahmin, Modelden Bağımsız Kontrol, Değer Fonksiyonu Yaklaşımı, Politika Gradyan Yöntemleri, Öğrenme ve Planlamanın Entegrasyonu, Keşif ve Kullanım, örnek olay incelemesi: RL’yi kapsamaktadır. Klasik Oyunlar. Slaytlara, ödevlere ve testlere erişmek için bağlantıya bakın.
Fonksiyon yaklaşımıyla takviyeli öğrenmeye giriş
DeepMind araştırma bilimcisi ve Alberta Üniversitesi’nde bilgisayar bilimi profesörü Rich S. Sutton, Markov karar süreçleri, merkezi çözüm yöntemleri, dinamik programlama, Monte yöntemleri Carlo ve öğrenme zamansal farkı gibi altta yatan biçimsel sorunu bu derinlemesine açıklıyor öğretici.
Takviyeli öğrenmenin tarihi
Massachusetts Amherst Üniversitesi’nde bilgisayar bilimi fahri profesörü olan Profesör AG Barto ayrıntılı bir ders veriyor. Bölümler arasında “hedonik nöron” hipotezi, denetimli öğrenme, takviyeli öğrenme, RL’nin benzersiz bir özelliği, Edward L Thorndike, etki yasası, RL = arama + hafıza, istisnalar olmasına rağmen ilk sürprizimiz, Rich ile erken bir makale yer alıyor. Sutton, İlişkisel Bellek Ağları, İlişkisel Arama Ağı ve çok daha fazlası.
NTPEL kursu
Kurs, Prof. Balaraman Ravindran, Bilgisayar Bilimi ve Mühendisliği ve Robert Bosch Veri Bilimi ve Yapay Zeka Merkezi, IIT-Madras’ın Takviyeli Öğrenim üzerine verdiği bir dizi dersi içermektedir. Kurs, takviyeli öğrenmenin temel matematiksel temellerini tanıtıyor ve araştırmalarının bazı son yönlerini vurguluyor. 12 haftalık konferansta hazırlık materyali, RL ve anlık RL’ye giriş, Bandit algoritmaları, politika gradyan yöntemleri ve Tam RL’ye giriş, MDP formülasyonu, Bellman denklemleri ve optimizasyon kanıtları, dinamik programlama ve Monte Carlo yöntemleri, Monte Carlo ve Zamansal Fark Yöntemleri yer alıyor. , Uygunluk İzleri, Fonksiyon Yaklaşımı, DQN, Düzeltilmiş Q ve Politika Gradyan Yaklaşımları, Hiyerarşik Pekiştirmeli Öğrenme, Hiyerarşik RL: MAXQ ve POMDP.
Yapay Zeka: Python’da Takviyeli Öğrenme
Yapay Zeka: Python’da Takviyeli Öğrenme, hisse senedi alım satımı ve çevrimiçi reklamcılık uygulamalarıyla takviyeli öğrenmeye yönelik eksiksiz bir kılavuzdur. 14,5 saatlik kurs, Udemy’de isteğe bağlı video olarak mevcuttur. Kılavuz size gradyan tabanlı denetimli makine öğrenimi yöntemlerini takviyeli öğrenmeye nasıl uygulayacağınızı, takviyeli öğrenmeyi teknik düzeyde nasıl anlayacağınızı, takviyeli öğrenme ile psikoloji arasındaki ilişkiyi anlamayı ve 17 farklı takviyeli öğrenme algoritmasını nasıl uygulayacağınızı öğretecek.
Unity’de pekiştirmeli öğrenme
Öğrenciler Unity3D’de takviyeli öğrenimi nasıl ayarlayacaklarını öğrenebilir ve küçük bir topu dengelemek için bir taşı eğitmek amacıyla oyun motorlarını yapay zekayla birleştirmenin gücünün kilidini açabilirler. Ayrıntıları https://github.com/Unity-Technologies adresinde bulabilirsiniz.
https://unity.com/
Takviyeli öğrenmeye giriş
Pratik takviyeli öğrenme
Coursera’nın uygulamalı takviyeli öğrenimi, RL yöntemlerinin temellerini kapsar: değer/politika yinelemesi, q-öğrenme, politika gradyanı vb.; RL görevleri için derin sinir ağlarını kullanın; son teknoloji RL algoritması; ve sinir ağlarına oynamayı öğretin.
Derin takviyeli öğrenme
GitHub’daki kursta, derin pekiştirmeli öğrenmede uzman olmanızı sağlayacak becerilerde ve mimarilerde uzmanlaşmanıza yardımcı olacak bir dizi makale ve video bulunmaktadır. Kurs, Space Invaders, Minecraft, Starcraft, Sonic the Hedgehog ve daha fazlasını nasıl oynayacağınızı öğrenen Tensorflow ve PyTorch’lu aracıları konuşlandırarak güçlü bir profesyonel portföy oluşturmanıza yardımcı olacaktır.