TensorFlow Lite 支持移动 GPU，速度推测提升4-6倍

栏目: IT资讯 · 发布时间: 6年前

内容简介：最近，开源机器学习框架 TensorFlow Lite 更新，新版更新支持了 GPU。支持 GPU 原因虽然移动设备的处理能力和功率都有限。虽然 TensorFlow Lite 提供了不少的加速途径，比如将机器学习模型转换成定点模型，但总...

最近，开源机器学习框架 TensorFlow Lite 更新，新版更新支持了 GPU。

支持 GPU 原因

虽然移动设备的处理能力和功率都有限。虽然 TensorFlow Lite 提供了不少的加速途径，比如将机器学习模型转换成定点模型，但总是会在模型的性能或精度上做出让步。而将GPU作为加速原始浮点模型的一种选择，不会增加量化的额外复杂性和潜在的精度损失。

随着 TensorFlow Lite GPU 后端开发者预览版的发布，将能够利用移动 GPU 来选择模型训练 (如下所示)，对于不支持的部分，将自动使用 CPU 进行推理。

新的后端利用了：

OpenGL ES 3.1 在 Android 设备上计算着色器
iOS 设备上的金属计算着色器

TensorFlow Lite 支持移动 GPU，速度推测提升4-6倍

目前 TensorFlow Lite 仍使用 CPU 浮点推断进行人脸轮廓检测 (非人脸识别)。未来会利用新的 GPU 后端，可以将 Pixel 3 和三星 S9 的推理速度提升 4~6 倍。

GPU 与 CPU 性能

在Pixel 3的人像模式（Portrait mode）中，与使用CPU相比，使用GPU的Tensorflow Lite，用于抠图/背景虚化的前景-背景分隔模型加速了4倍以上。新深度估计（depth estimation）模型加速了10倍以上。

在能够为视频增加文字、滤镜等特效的YouTube Stories和谷歌的相机AR功能Playground Stickers中，实时视频分割模型在各种手机上的速度提高了5-10倍。

TensorFlow Lite 支持移动 GPU，速度推测提升4-6倍

对于不同的深度神经网络模型，使用新GPU后端，通常比浮点CPU快2-7倍。对4个公开模型和2个谷歌内部模型进行基准测试的效果如下：

在更加复杂的神经网络模型上 GPU 加速效果最显著，这些模型本身更有利于 GPU 的利用，例如密集的预测 / 分割或分类任务。在小型模型中，加速效果效果可能略差，但 CPU 的使用可以降低内存传输固有的延迟成本。

另外，关于如何加速的问题——为了获得最佳体验，建议优化输入 / 输出张量复制和 / 或网络架构。有关此类优化的详细信息，可以在 TensorFlow Lite GPU 文档中找到。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

微信营销与运营一册通

何秀芳、葛存山 / 人民邮电出版社 / 2014-10

《微信营销与运营一册通》深入介绍了当今最为火热的话题——微信营销，内容全面、系统和深入。它基于微信的最新版本，从策略、技巧与案例等多角度详细解析了微信的营销与运营，所有内容都是行业经验的结晶，旨在为企业或个人运用微信提供有价值的参考。《微信营销与运营一册通》主要内容如下。 * 5大微信营销利器：书中介绍了5大微信营销利器，包括漂流瓶、二维码、LBS功能、朋友圈和公众平台等。 * 6大微......一起来看看《微信营销与运营一册通》这本书的介绍吧!

码农工具

TensorFlow Lite 支持移动 GPU，速度推测提升4-6倍

微信营销与运营一册通

在线进制转换器

图片转BASE64编码

URL 编码/解码