Wenn Sie diesen Text sehen, ist auf ihrem Gerät noch nicht das neue Layout geladen worden. Bitte laden Sie diese Seite neu (ggf. mit gedrückter 'Shift'- oder 'Alt'-Taste) oder in einem 'privaten Fenster'.
Weitere Hinweise unter https://www.uni-hildesheim.de/wiki/lsf/faq/fehler.im.layout.

Zur Seitennavigation oder mit Tastenkombination für den accesskey-Taste und Taste 1 
Zum Seiteninhalt oder mit Tastenkombination für den accesskey und Taste 2 
  1. SucheSuchen         
  2. SoSe 2024
  3. Hilfe
  4. Sitemap
Switch to english language
Startseite    Anmelden     

Data Analytics II - Einzelansicht

Grunddaten
Veranstaltungsart Seminar Learnweb   Logo Learnweb
Veranstaltungsnummer 3108 Kurztext
Semester WiSe 2023/24 SWS 2
Erwartete Teilnehmer/-innen Max. Teilnehmer/-innen
Rhythmus i.d.R. jedes Semester Studienjahr / Zielgruppe
Credits 4
Hyperlink https://www.ismll.uni-hildesheim.de/lehre/semDA2-21w/index.html Evaluation Ja - Präsenzveranstaltung
Sprache englisch
Termine Gruppe: 1-Gruppe iCalendar Export
  Tag Zeit Rhythmus Dauer Raum (mögliche Änderungen beachten!) Raum-
plan
Lehrperson Status Bemerkung fällt aus am Max. Teilnehmer/-innen
Einzeltermine anzeigen
iCalendar Export
Di. 14:00 bis 16:00 c.t. wöchentlich Gebäude B (Samelson-Campus) - SC.B.0.26 (Seminarraum) Raumplan        
Gruppe 1-Gruppe:


Zugeordnete Personen
Kontaktperson (durchführend) Zuständigkeit
Dernedde, Tim durchführend, nicht verantwortlich
Weitere Person Zuständigkeit
Schmidt-Thieme, Lars, Professor Dr. Dr. verantwortlich, nicht durchführend
Studiengänge
Abschluss Studiengang Semester ECTS Kontingent
Master M.Sc. Data Analytics
Master M.Sc. IMIT Studienvar. AI
Master M.Sc. Informationsmanagm.
Master M.Sc. Wirtschaftsinf.
LSF - Module
Modulkürzel Modultitel
MWI-SemBI Seminar Business Intelligence (Master)
MWI-BI-S4L Seminar, Ergänzung zu Prüfungen aus dem Modul Business Intelligence mit 4 LP
MDA-SDA2 Seminar Data Analytics II
0ERA-4LP Veranstaltungen mit 4 Credits f. ausl. Programmstud. (ERASMUS)
MIT-SKIML Seminar Künstliche Intelligenz und Maschinelles Lernen (Master)
Zuordnung zu Einrichtungen
Abt. Wirtschaftsinformatik und Maschinelles Lernen
Inhalt
Literatur

Chen, L., Lu, K., Rajeswaran, A., Lee, K., Grover, A., Laskin, M., Abbeel, P., Srinivas, A., Mordatch, I., 2021. Decision Transformer: Reinforcement Learning via Sequence Modeling. https://doi.org/10.48550/arXiv.2106.01345
Dabney, W., Ostrovski, G., Silver, D., Munos, R., 2018. Implicit Quantile Networks for Distributional Reinforcement Learning. https://doi.org/10.48550/arXiv.1806.06923
Fu, J., Luo, K., Levine, S., 2018. Learning Robust Rewards with Adversarial Inverse Reinforcement Learning. https://doi.org/10.48550/arXiv.1710.11248
Haarnoja, T., Zhou, A., Abbeel, P., Levine, S., 2018. Soft actor-critic: Off-policy maximum entropy deep reinforcement learning with a stochastic actor, in: International Conference on Machine Learning. pp. 1861–1870.
Hessel, M., Modayil, J., Van Hasselt, H., Schaul, T., Ostrovski, G., Dabney, W., Horgan, D., Piot, B., Azar, M., Silver, D., 2018. Rainbow: Combining improvements in deep reinforcement learning, in: Thirty-Second AAAI Conference on Artificial Intelligence.
Kumar, A., Zhou, A., Tucker, G., Levine, S., 2020. Conservative Q-Learning for Offline Reinforcement Learning. https://doi.org/10.48550/arXiv.2006.04779
Lu, C., Kuba, J.G., Letcher, A., Metz, L., de Witt, C.S., Foerster, J., 2022. Discovered Policy Optimisation.
Mnih, V., Badia, A.P., Mirza, M., Graves, A., Lillicrap, T., Harley, T., Silver, D., Kavukcuoglu, K., 2016. Asynchronous methods for deep reinforcement learning, in: International Conference on Machine Learning. pp. 1928–1937.
Mnih, V., Kavukcuoglu, K., Silver, D., Graves, A., Antonoglou, I., Wierstra, D., Riedmiller, M., 2013. Playing Atari with Deep Reinforcement Learning.
Nagabandi, A., Kahn, G., Fearing, R.S., Levine, S., 2017. Neural Network Dynamics for Model-Based Deep Reinforcement Learning with Model-Free Fine-Tuning. https://doi.org/10.48550/arXiv.1708.02596
Ouyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C.L., Mishkin, P., Zhang, C., Agarwal, S., Slama, K., Ray, A., Schulman, J., Hilton, J., Kelton, F., Miller, L., Simens, M., Askell, A., Welinder, P., Christiano, P., Leike, J., Lowe, R., 2022. Training language models to follow instructions with human feedback.
Schrittwieser, J., Antonoglou, I., Hubert, T., Simonyan, K., Sifre, L., Schmitt, S., Guez, A., Lockhart, E., Hassabis, D., Graepel, T., Lillicrap, T., Silver, D., 2020. Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model. Nature 588, 604–609. https://doi.org/10.1038/s41586-020-03051-4
Schulman, J., Levine, S., Abbeel, P., Jordan, M., Moritz, P., 2015. Trust region policy optimization, in: International Conference on Machine Learning. pp. 1889–1897.
Schulman, J., Moritz, P., Levine, S., Jordan, M., Abbeel, P., 2018. High-Dimensional Continuous Control Using Generalized Advantage Estimation.
Schulman, J., Wolski, F., Dhariwal, P., Radford, A., Klimov, O., 2017. Proximal policy optimization algorithms. arXiv preprint arXiv:1707.06347.
Silver, D., Hubert, T., Schrittwieser, J., Antonoglou, I., Lai, M., Guez, A., Lanctot, M., Sifre, L., Kumaran, D., Graepel, T., Lillicrap, T., Simonyan, K., Hassabis, D., 2017. Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. https://doi.org/10.48550/arXiv.1712.01815
Silver, D., Lever, G., Heess, N., Degris, T., Wierstra, D., Riedmiller, M., 2014. Deterministic policy gradient algorithms, in: International Conference on Machine Learning. pp. 387–395.
Van Hasselt, H., Guez, A., Silver, D., 2016. Deep reinforcement learning with double q-learning, in: Proceedings of the AAAI Conference on Artificial Intelligence.

Lerninhalte

The topic of this seminar is Reinforcement Learning

Zielgruppe

MSc WI & IMIT & AINF & DA -  MSc 1-3


Strukturbaum
Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester WiSe 2023/24 , Aktuelles Semester: SoSe 2024
Impressum      Datenschutzerklärung     Datenschutz      Datenschutzerklärung     Erklärung zur Barrierefreiheit