Paddle 0.13.0 发布,百度开源的深度学习平台

栏目: 软件资讯 · 发布时间: 7年前

内容简介:Paddle 0.13.0 已发布,PaddlePaddle (PArallel Distributed Deep LEarning 并行分布式深度学习)是百度研发的深度学习平台,具有易用,高效,灵活和可伸缩等特点,为百度内部多项产品提供深度学习算法支持。 支持...

Paddle 0.13.0 已发布,PaddlePaddle (PArallel Distributed Deep LEarning 并行分布式深度学习)是百度研发的深度学习平台,具有易用,高效,灵活和可伸缩等特点,为百度内部多项产品提供深度学习算法支持。

支持的特性

- 易用性:为用户提供了直观且灵活的数据接口和模型定义接口
- 灵活性:PaddlePaddle支持多种神经网络结构和优化算法。简单书写配置文件即可实现复杂模型,如带注意力机制或复杂记忆连接的神经机器翻译模型
- 高效性:为充分发挥多种计算资源的效力,PaddlePaddle在计算、存储、架构、通信等多方面都做了细致优化,性能优异
- 可伸缩性:PaddlePaddle全面支持多核、多GPU、多机环境,优化的通信实现使高吞吐与高性能成为可能,轻松应对大规模数据训练需求

本次更新的内容包括:添加新特性、提升性能以及修复 bug。

主要特性

  • 支持异步分布式训练

  • 使用 ParallelExecutor 进行分布式训练

  • 使用 NCCL2 进行分布式环型培训

  • 支持将 checkpoint 保存在训练器以及存储在训练器和参数服务器上

  • 参数服务器的优雅关闭

  • 发布高级的 inference lib API 和 inference 实现

  • 为每个操作分配角色

  • 发布 C++ 训练 API 以允许将流体嵌入到其他 C++ 系统中

  • 支持 uint8_t 类型的数据文件和数据交换

  • C++ 阅读器支持定制数据的增长

  • 改进了语音模型的操作器和界面支持

  • 新的 random_crop op

  • 新的 shape op以获取张量(tensor)的形状

  • 新的 resize_bilinear interface.

  • 新的 dice_loss layer.

  • 增强 reduce_op 以支持在多维度上的削减

性能提升

在 P40 GPU ResNet-50 模型上,单个 GPU 速度提升了 23.8% (105 images/sec to 130 images/sec)。8 个 GPU 的加速比达到 6,32 个 GPU 的加速比达到 17.4。

  • Overlap send/recv op with other operators.

  • Multi-thread server-side request handling.

  • Weight decay and clipping moved from trainer to parameter server for performance and correctness.

  • Improved C++ reader.

主要的 bug 修复

  • Fix accuracy loss when both ParallelExecutor and memory optimizer are used.

  • Fix ParallelExecutor hang when multiple inputs duplicate.

  • Fix Program clone cause memory leak.

  • Fix GRU unit bias ineffective and wrong activation.

  • Fix ROI Pooling GPU computation issues.

  • Fix fill_constant_batch_size_like when input is sequence.

  • Fix reshape op.

下载地址


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上所述就是小编给大家介绍的《Paddle 0.13.0 发布,百度开源的深度学习平台》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

30天自制操作系统

30天自制操作系统

[日] 川合秀实 / 周自恒、李黎明、曾祥江、张文旭 / 人民邮电出版社 / 2012-8 / 99.00元

自己编写一个操作系统,是许多程序员的梦想。也许有人曾经挑战过,但因为太难而放弃了。其实你错了,你的失败并不是因为编写操作系统太难,而是因为没有人告诉你那其实是一件很简单的事。那么,你想不想再挑战一次呢? 这是一本兼具趣味性、实用性与学习性的书籍。作者从计算机的构造、汇编语言、C语言开始解说,让你在实践中掌握算法。在这本书的指导下,从零编写所有代码,30天后就可以制作出一个具有窗口系统的32位......一起来看看 《30天自制操作系统》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

MD5 加密
MD5 加密

MD5 加密工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器