Marmara Üniversitesi-Fakülte>SubContent

Doktora - Fen Bilimleri Enstitüsü - Bilgisayar Mühendisliği (İngilizce)

Müfredat Adı	Ders Kodu	Ders Adı	Ders Türü	Dönem	AKTS	Teorik	Uygulama
Bilgisayar Mühendisliği - Bilgisayar Mühendisliği (İngilizce) - Doktora - 2014	CSE8004	Reinforcement Learning	Seçmeli	1	8,00	3	0

Dersin İçeriği

Dersin Amacı

Öğrenciye pekiştirmeli öğrenmenin temellerini, kullanım alanlarını, hangi tür problemleri çözebileceğini anlatmaktır

Öğrenim Türü

Dersin İçeriği

Aşağıdaki kavramların açıklanması ve tartışılması: : değerlendirmeli geribildirim ve denetimli geribildirimden farkı, bir problemi bir PÖ problemi olarak tanımlama, kusursuz modeli olan PÖ ortamları: (öğrenme ne zaman kaçınılmazdır?), Monte Carlo and zaman farklı yöntemler (model kullanmayan (belleksiz) etmenler), uygunluk belirteçleri, planlama ve PÖde kullanımları (model-temelli etmenler) ve ileri PÖ yöntemlerine kısa bir giriş

Planlanan Öğrenme Aktiviteleri ve Metodları

Ders notları, PPT sunumları,

Staj Durumu

Yok

Dersin Sunulduğu Dil

İngilizce

Ders Kitabı / Malzemesi / Önerilen Kaynaklar

Introduction to reinforcement learning, Richard Sutton and Andrew Barto, 2nd ed., 2013

Dersin Web Sayfası

https://mimoza.marmara.edu.tr/~borahan.tumer/RL-CSE804/material.html

Öğrenme Çıktıları

Haftalık Ayrıntılı Ders İçeriği

Hafta	Teorik
1	Giriş
2	Değerlendirmeli Geribildirim - bölüm 1
3	Değerlendirmeli Geribildirim - bölüm 2
4	Bir problemi pekiştirmeli öğrenme ile çözülebilir duruma getirmek - bölüm 1
5	Bir problemi pekiştirmeli öğrenme ile çözülebilir duruma getirmek - bölüm 2
6	Kusursuz modelli ortamlarda pekiştirmeli öğrenme... Devingen programlama: bölüm 1
7	Kusursuz modelli ortamlarda pekiştirmeli öğrenme... Devingen programlama: bölüm 2
8	Ara sınav
9	Monte Carlo yöntemleri - bölüm 1
10	Monte Carlo yöntemleri - bölüm 2
11	Zaman farklı öğrenme - bölüm 1
12	Zaman farklı öğrenme - bölüm 2
13	Uygunluğun belirlenmesi
14	Pekiştirmeli öğrenmede planlama: Model kullanan etmenler - bölüm 1
15	Pekiştirmeli öğrenmede planlama: Model kullanan etmenler - bölüm 2
16	Pekiştirmeli öğrenmede ileri konular: sıradüzensel pekiştirmeli öğrenme, bilgi aktarımı ve NEAT
17

Değerlendirme

Değerlendirme	Değer
Yarıyıl (Yıl) İçi Etkinlikleri	50
Yarıyıl (Yıl) Sonu Etkinlikleri	50
Yarıyıl (Yıl) Sonu Etkinlikleri	Değer
Final Sınavı	100

Öğrenci İş Yükü Hesabı

Etkinlikler	Sayısı	Süresi (saat)	Toplam İş Yükü (saat)
Ders Öncesi/Sonrası Bireysel Çalışma	0	0	0
Proje ve Hazırlığı	2	40	80
Ödev ve Hazırlığı	7	3	21
Laboratuvar ve Hazırlığı	0	0	0
Atölye ve Hazırlığı	0	0	0
Sunum ve Hazırlığı	0	0	0
Seminer ve Hazırlığı	0	0	0
Demo ve Hazırlığı	0	0	0
Araştırma ve Hazırlığı	0	0	0
Rapor ve Hazırlığı	2	12	24
Arasınav ve Hazırlığı	1	35	35
Kısa Sınav ve Hazırlığı	0	0	0
Final ve Hazırlığı	1	40	40
Teorik Ders Saati	0	0	0
Uygulama Ders Saati	0	0	0

Marmara Üniversitesi
Marmara Üniversitesi Eğitim-Öğretim Bilgi Sistemi

Programlar Hakkında Bilgi

Doktora - Fen Bilimleri Enstitüsü - Bilgisayar Mühendisliği (İngilizce)

Dersin İçeriği

Öğrenme Çıktıları

Haftalık Ayrıntılı Ders İçeriği

Değerlendirme

Öğrenci İş Yükü Hesabı

Program ve Öğrenme Çıktıları İlişkisi