【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

栏目: 数据库 · 发布时间: 6年前

内容简介:AI 研习社又有新的学习小组啦!赶快加入我们吧!扫描二维码,即可加入小组

AI 研习社又有新的学习小组啦!赶快加入我们吧!

扫描二维码,即可加入小组

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

课程开始后,小组成员可免费观看课程视频~

AI 研习社获得官方授权,汉化翻译伯克利大学 CS 294-112 《深度强化学习》,于本周四(2018 年 12 月 20 日)正式上线中文字幕版。

伯克利大学 CS 294-112 《深度强化学习》为官方开源最新版本,由伯克利大学该门课程授课讲师 Sergey Levine 授权 AI 研习社翻译。

观看网址: https://ai.yanxishe.com/page/groupDetail/30 (加入小组后即可直接观看)

课程主页: http://rail.eecs.berkeley.edu/deeprlcourse/

油管链接: https://www.youtube.com/playlist?list=PLkFD6_40KJIxJMR-j5A1mkxK26gh_qg37

12 月 20 日开始正式同步更新在 AI 研习社,大约1到2周更新一次。

该课程主题选择深度增强学习,即紧跟当前人工智能研究的热点,又可作为深度学习的后续方向,值得推荐。

   先修要求

想要学习伯克利大学 CS 294-112 《深度强化学习》这门课程,学生需要先学习 CS189 或者其他同等学力课程。本课程将假定学生掌握强化学习、数值优化和机器学习的相关背景知识。 雷锋网雷锋网 (公众号:雷锋网) 雷锋网

如果你对上述主题不是非常了解,那么需要自主学习补充以下知识点:

  • 增强学习和马尔科夫决策过程(MDPs)

MDPs的定义

具体算法:策略迭代和价值迭代

搜索算法

  • 数值最优化方法

梯度下降和随机梯度下降

反向传播算法

  • 机器学习

分类和回归问题:用什么样的损失函数,如何拟合线性或非线性模型

训练/测试误差,过拟合

  视频截图    

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

【官方授权】2018 秋季伯克利大学 CS 294-112 《深度强化学习》学习小组成员招募

   课程大纲

第一讲:课程介绍和概览

第二讲:监督学习和模仿学习

第三讲:TensorFlow 和神经网络简述

第四讲:强化学习简介

第五讲:策略梯度简介

第六讲:Actor-Critic 算法简介

第七讲:价值函数介绍

第八讲:高级 Q-学习算法

第九讲:高级策略梯度

第十讲:最优控制和规划

第十一讲:基于模型的强化学习

第十二讲:高级强化学习和图像处理应用

第十三讲:利用模仿优化控制器学习策略

第十四讲:概率和变分推断入门

第十五讲:推断和控制之间的联系

第十六讲:逆向强化学习

第十七讲:探索(上)

第十八讲:探索(下)

第十九讲:迁移学习与多任务学习

第二十讲:元学习

第二十一讲:平行结构和强化学习系统设计

第二十二讲:进阶模仿学习和开放性问题

第二十三讲:客座讲师:Craig Boutilier

第二十四讲:客座讲师:Gregory Kahn

第二十五讲:客座讲师:Quoc Le & Barret Zoph

第二十六讲:客座讲师:Karol Hausman

快来加入学习小组吧!

点击链接: https://ai.yanxishe.com/page/groupDetail/30 选择【加入小组】


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Mathematica Cookbook

Mathematica Cookbook

Sal Mangano / O'Reilly Media / 2009 / GBP 51.99

As the leading software application for symbolic mathematics, Mathematica is standard in many environments that rely on math, such as science, engineering, financial analysis, software development, an......一起来看看 《Mathematica Cookbook》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具