Müfredat Adı | Ders Kodu | Ders Adı | Ders Türü | Dönem | AKTS | Teorik | Uygulama |
Bilgisayar Mühendisliği - Bilgisayar Mühendisliği (İngilizce) - Doktora - 2014 | CSE8004 | Reinforcement Learning | Seçmeli | 1 | 8,00 | 3 | 0 |
Müfredat Adı | Ders Kodu | Ders Adı | Ders Türü | Dönem | AKTS | Teorik | Uygulama |
Bilgisayar Mühendisliği - Bilgisayar Mühendisliği (İngilizce) - Doktora - 2014 | CSE8004 | Reinforcement Learning | Seçmeli | 1 | 8,00 | 3 | 0 |
Öğrenciye pekiştirmeli öğrenmenin temellerini, kullanım alanlarını, hangi tür problemleri çözebileceğini anlatmaktır
-
Aşağıdaki kavramların açıklanması ve tartışılması: : değerlendirmeli geribildirim ve denetimli geribildirimden farkı, bir problemi bir PÖ problemi olarak tanımlama, kusursuz modeli olan PÖ ortamları: (öğrenme ne zaman kaçınılmazdır?), Monte Carlo and zaman farklı yöntemler (model kullanmayan (belleksiz) etmenler), uygunluk belirteçleri, planlama ve PÖde kullanımları (model-temelli etmenler) ve ileri PÖ yöntemlerine kısa bir giriş
Ders notları, PPT sunumları,
Yok
İngilizce
Introduction to reinforcement learning, Richard Sutton and Andrew Barto, 2nd ed., 2013
https://mimoza.marmara.edu.tr/~borahan.tumer/RL-CSE804/material.html
Hafta | Teorik |
---|---|
1 | Giriş |
2 | Değerlendirmeli Geribildirim - bölüm 1 |
3 | Değerlendirmeli Geribildirim - bölüm 2 |
4 | Bir problemi pekiştirmeli öğrenme ile çözülebilir duruma getirmek - bölüm 1 |
5 | Bir problemi pekiştirmeli öğrenme ile çözülebilir duruma getirmek - bölüm 2 |
6 | Kusursuz modelli ortamlarda pekiştirmeli öğrenme... Devingen programlama: bölüm 1 |
7 | Kusursuz modelli ortamlarda pekiştirmeli öğrenme... Devingen programlama: bölüm 2 |
8 | Ara sınav |
9 | Monte Carlo yöntemleri - bölüm 1 |
10 | Monte Carlo yöntemleri - bölüm 2 |
11 | Zaman farklı öğrenme - bölüm 1 |
12 | Zaman farklı öğrenme - bölüm 2 |
13 | Uygunluğun belirlenmesi |
14 | Pekiştirmeli öğrenmede planlama: Model kullanan etmenler - bölüm 1 |
15 | Pekiştirmeli öğrenmede planlama: Model kullanan etmenler - bölüm 2 |
16 | Pekiştirmeli öğrenmede ileri konular: sıradüzensel pekiştirmeli öğrenme, bilgi aktarımı ve NEAT |
17 |
Değerlendirme | Değer |
---|---|
Yarıyıl (Yıl) İçi Etkinlikleri | 50 |
Yarıyıl (Yıl) Sonu Etkinlikleri | 50 |
Yarıyıl (Yıl) Sonu Etkinlikleri | Değer |
Final Sınavı | 100 |
Etkinlikler | Sayısı | Süresi (saat) | Toplam İş Yükü (saat) |
---|---|---|---|
Ders Öncesi/Sonrası Bireysel Çalışma | 0 | 0 | 0 |
Proje ve Hazırlığı | 2 | 40 | 80 |
Ödev ve Hazırlığı | 7 | 3 | 21 |
Laboratuvar ve Hazırlığı | 0 | 0 | 0 |
Atölye ve Hazırlığı | 0 | 0 | 0 |
Sunum ve Hazırlığı | 0 | 0 | 0 |
Seminer ve Hazırlığı | 0 | 0 | 0 |
Demo ve Hazırlığı | 0 | 0 | 0 |
Araştırma ve Hazırlığı | 0 | 0 | 0 |
Rapor ve Hazırlığı | 2 | 12 | 24 |
Arasınav ve Hazırlığı | 1 | 35 | 35 |
Kısa Sınav ve Hazırlığı | 0 | 0 | 0 |
Final ve Hazırlığı | 1 | 40 | 40 |
Teorik Ders Saati | 0 | 0 | 0 |
Uygulama Ders Saati | 0 | 0 | 0 |