重磅 | CS 294 2018 今日开课!双语字幕独家上线!

栏目: 数据库 · 发布时间: 7年前

内容简介:AI 研习社获得官方授权,汉化翻译伯克利大学 CS 294-112 《深度强化学习》,今天正式上线中英双语字幕版课程啦!我们先来一睹为快——上手视频约 5 分钟

AI 研习社获得官方授权,汉化翻译伯克利大学 CS 294-112 《深度强化学习》,今天正式上线中英双语字幕版课程啦!

我们先来一睹为快——

第一讲

课程介绍和概览

上手视频约 5 分钟

翻译 | 朱海浩   段小杰   周清逸      字幕 | 凡江

看完是不是不够过瘾!

请扫描下方二维码, 加入官方学习小组

或者直接点击链接: https://ai.yanxishe.com/page/groupDetail/30

即可观看 完整视频

↓↓↓

重磅 | CS 294 2018 今日开课!双语字幕独家上线!

回复字幕君(微信:leiphonefansub)

加入该课程小组的截图

我们将你拉 入微信群聊

重磅 | CS 294 2018 今日开课!双语字幕独家上线!

添加时备注“CS294加群”~

   课程介绍

重磅 | CS 294 2018 今日开课!双语字幕独家上线!

伯克利大学 CS 294-112 《深度强化学习》为官方开源最新版本,由伯克利大学该门课程授课讲师 Sergey Levine 授权 AI 研习社翻译。

12 月 20 日开始正式同步更新在 AI 研习社,大约 1 到 2 周更新一次。

该课程主题选择深度增强学习,即紧跟当前人工智能研究的热点,又可作为深度学习的后续方向,值得推荐。

   先修要求

想要学习伯克利大学 CS 294-112 《深度强化学习》这门课程,学生需要先学习 CS189 或者其他同等学力课程。本课程将假定学生掌握强化学习、数值优化和机器学习的相关背景知识。

如果你对上述主题不是非常了解,那么需要自主学习补充以下知识点:

  • 增强学习和马尔科夫决策过程(MDPs)

MDPs的定义

具体算法:策略迭代和价值迭代

搜索算法

  • 数值最优化方法

梯度下降和随机梯度下降

反向传播算法

  • 机器学习

分类和回归问题:用什么样的损失函数,如何拟合线性或非线性模型

训练/测试误差,过拟合

   视频截图

重磅 | CS 294 2018 今日开课!双语字幕独家上线!

重磅 | CS 294 2018 今日开课!双语字幕独家上线!

重磅 | CS 294 2018 今日开课!双语字幕独家上线!

   译者评价

比较有趣,讲课用很多例子来解释,不是那种光给你一大堆公式概念的,感觉偏重实际应用和前沿技术一点,推荐大家来看。

@周清逸

这门课是基本覆盖了强化学习的主要内容和前沿的研究话题,通过理论到应用例子的讲述,以及五次作业(实际上是七次)的实践练习对经典算法的复现,可以让学生达到在强化学习领域的入门研究水平。重点是免费!课程有中文字幕!有作业参考!不过这门课并不是零门槛,需要上过机器学习课程,最好是还上过深度学习(比如cmu deeplearning),最最好用过tensorflow(因为作业的官方基础代码只有tensorflow版本)。

@朱海浩

侧重于增强学习与深度学习相结合,应用在机器人方面的例子比较多,翻译的话老师语速挺快的,虽然语气词比较多,整体逻辑很清晰。

@段小杰

   课程大纲

第一讲:课程介绍和概览

第二讲:监督学习和模仿学习

第三讲:TensorFlow 和神经网络简述

第四讲:强化学习简介

第五讲:策略梯度简介

第六讲:Actor-Critic 算法简介

第七讲:价值函数介绍

第八讲:高级 Q-学习算法

第九讲:高级策略梯度

第十讲:最优控制和规划

第十一讲:基于模型的强化学习

第十二讲:高级强化学习和图像处理应用

第十三讲:利用模仿优化控制器学习策略

第十四讲:概率和变分推断入门

第十五讲:推断和控制之间的联系

第十六讲:逆向强化学习

第十七讲:探索(上)

第十八讲:探索(下)

第十九讲:迁移学习与多任务学习

第二十讲:元学习

第二十一讲:平行结构和强化学习系统设计

第二十二讲:进阶模仿学习和开放性问题

第二十三讲:客座讲师:Craig Boutilier

第二十四讲:客座讲师:Gregory Kahn

第二十五讲:客座讲师:Quoc Le & Barret Zoph

第二十六讲:客座讲师:Karol Hausman

   相关材料

有关强化学习与 MDP 的介绍资料:

CS188 EdX 课程,从马尔可夫决策过程 I 开始: http://ai.berkeley.edu/home.html

Richard S. Sutton 与 Andrew G. Barto 的《强化学习导论》,第三章和第四章: http://incompleteideas.net/book/the-book-2nd.html

有关 MDP 的介绍,请参阅吴恩达的论文《Shaping and policy search in Reinforcement learning》: http://rll.berkeley.edu/deeprlcourse/docs/ng-thesis.pdf

David Silver 的课程: http://rll.berkeley.edu/deeprlcourse/#related-materials

有关机器学习和神经网络的介绍性资料,请参阅:

Andrej Karpathy 的课程: http://cs231n.github.io/

Geoff Hinton 的 Coursera 课程: https://www.coursera.org/learn/neural-networks

吴恩达的 Coursera 课程: https://www.coursera.org/learn/machine-learning/

Yaser Abu-Mostafa 的课程: https://work.caltech.edu/telecourse.html

写在最后:想要参与这门课程的翻译?添加雷锋字幕组微信 leiphonefansub 为好友,备注CS294译者,即可报名,译者招募长期有效哦~ 雷锋网雷锋网 (公众号:雷锋网) 雷锋网

雷锋网原创文章,未经授权禁止转载。详情见 转载须知

重磅 | CS 294 2018 今日开课!双语字幕独家上线!

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Java Message Service API Tutorial and Reference

Java Message Service API Tutorial and Reference

Hapner, Mark; Burridge, Rich; Sharma, Rahul / 2002-2 / $ 56.49

Java Message Service (JMS) represents a powerful solution for communicating between Java enterprise applications, software components, and legacy systems. In this authoritative tutorial and comprehens......一起来看看 《Java Message Service API Tutorial and Reference》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

html转js在线工具
html转js在线工具

html转js在线工具