Marmara Üniversitesi
Marmara Üniversitesi Eğitim-Öğretim Bilgi Sistemi

Programlar Hakkında Bilgi

Doktora - Fen Bilimleri Enstitüsü - Bilgisayar Mühendisliği (İngilizce)

Müfredat Adı Ders Kodu Ders Adı Ders Türü Dönem AKTS Teorik Uygulama
Bilgisayar Mühendisliği - Bilgisayar Mühendisliği (İngilizce) - Doktora - 2014 CSE8004 Reinforcement Learning Seçmeli 1 8,00 3 0

Dersin İçeriği

Dersin Amacı

Öğrenciye pekiştirmeli öğrenmenin temellerini, kullanım alanlarını, hangi tür problemleri çözebileceğini anlatmaktır

Öğrenim Türü

-

Dersin İçeriği

Aşağıdaki kavramların açıklanması ve tartışılması: : değerlendirmeli geribildirim ve denetimli geribildirimden farkı, bir problemi bir PÖ problemi olarak tanımlama, kusursuz modeli olan PÖ ortamları: (öğrenme ne zaman kaçınılmazdır?), Monte Carlo and zaman farklı yöntemler (model kullanmayan (belleksiz) etmenler), uygunluk belirteçleri, planlama ve PÖde kullanımları (model-temelli etmenler) ve ileri PÖ yöntemlerine kısa bir giriş

Planlanan Öğrenme Aktiviteleri ve Metodları

Ders notları, PPT sunumları,

Staj Durumu

Yok

Dersin Sunulduğu Dil

İngilizce

Ders Kitabı / Malzemesi / Önerilen Kaynaklar

Introduction to reinforcement learning, Richard Sutton and Andrew Barto, 2nd ed., 2013

Dersin Web Sayfası

https://mimoza.marmara.edu.tr/~borahan.tumer/RL-CSE804/material.html

Öğrenme Çıktıları

Haftalık Ayrıntılı Ders İçeriği

Hafta Teorik
1 Giriş
2 Değerlendirmeli Geribildirim - bölüm 1
3 Değerlendirmeli Geribildirim - bölüm 2
4 Bir problemi pekiştirmeli öğrenme ile çözülebilir duruma getirmek - bölüm 1
5 Bir problemi pekiştirmeli öğrenme ile çözülebilir duruma getirmek - bölüm 2
6 Kusursuz modelli ortamlarda pekiştirmeli öğrenme... Devingen programlama: bölüm 1
7 Kusursuz modelli ortamlarda pekiştirmeli öğrenme... Devingen programlama: bölüm 2
8 Ara sınav
9 Monte Carlo yöntemleri - bölüm 1
10 Monte Carlo yöntemleri - bölüm 2
11 Zaman farklı öğrenme - bölüm 1
12 Zaman farklı öğrenme - bölüm 2
13 Uygunluğun belirlenmesi
14 Pekiştirmeli öğrenmede planlama: Model kullanan etmenler - bölüm 1
15 Pekiştirmeli öğrenmede planlama: Model kullanan etmenler - bölüm 2
16 Pekiştirmeli öğrenmede ileri konular: sıradüzensel pekiştirmeli öğrenme, bilgi aktarımı ve NEAT
17

Değerlendirme

Değerlendirme Değer
Yarıyıl (Yıl) İçi Etkinlikleri 50
Yarıyıl (Yıl) Sonu Etkinlikleri 50
Yarıyıl (Yıl) Sonu Etkinlikleri Değer
Final Sınavı 100

Öğrenci İş Yükü Hesabı

Etkinlikler Sayısı Süresi (saat) Toplam İş Yükü (saat)
Ders Öncesi/Sonrası Bireysel Çalışma 0 0 0
Proje ve Hazırlığı 2 40 80
Ödev ve Hazırlığı 7 3 21
Laboratuvar ve Hazırlığı 0 0 0
Atölye ve Hazırlığı 0 0 0
Sunum ve Hazırlığı 0 0 0
Seminer ve Hazırlığı 0 0 0
Demo ve Hazırlığı 0 0 0
Araştırma ve Hazırlığı 0 0 0
Rapor ve Hazırlığı 2 12 24
Arasınav ve Hazırlığı 1 35 35
Kısa Sınav ve Hazırlığı 0 0 0
Final ve Hazırlığı 1 40 40
Teorik Ders Saati 0 0 0
Uygulama Ders Saati 0 0 0

Program ve Öğrenme Çıktıları İlişkisi