支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别

栏目: IT技术 · 发布时间: 3年前

内容简介:来源 | 机器之心编辑 | 路

  磐创AI分享   

来源 | 机器之心

编辑 | 路

【导读】 Easy OCR 支持 40 多种语言,所需的 GPU 内存为 2GB+,并且支持在 CPU 模式中运行。

OCR(光学字符识别)是是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。目前,这项技术在拍照搜题、拍照翻译等应用中得到广泛使用。

今天,我们来介绍一个支持 40 多种语言的 OCR 库:Easy OCR。

GitHub 地址:https://github.com/JaidedAI/EasyOCR

该 OCR 库使用深度神经网络构建而成:CNN+LSTM+CTC loss,包含三个解码器可选项:贪心搜索、束搜索和词束搜索(word-beam search)。

据介绍,Easy OCR 的性能可与商业 API 解决方案媲美,且已开源,支持本地运行,因此适合关注数据隐私和适应性的人使用。

作者表示:与标准的开源 OCR 工具 Tesseract 相比,Easy OCR 的准确率更高,不过速度稍慢。

支持 40+ 种语言,识别效果优秀

Easy OCR 支持对 42 多种语言执行 OCR 识别,包括简繁中文、日语、韩语、英语、德语、乌兹别克语、越南语、斯瓦希里语等。

支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别

Easy OCR 支持的语言清单。

下图展示了 Easy OCR 的识别效果:

支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别

Easy OCR 的识别结果

此外,Easy OCR 所需的 GPU 内存为 2GB+,并且支持在 CPU 模式中运行,因此具备较强的实用性。

Easy OCR 的原理

如前所述,Easy OCR 利用 CNN+LSTM+CTC loss 构建而成,包括三个解码器可选项:贪心搜索、束搜索和词束搜索(word-beam search)。其中检测部分基于 CRAFT 算法预训练得到,识别部分则基于作者自有数据集训练得到。

CRAFT 是一个字符级别的文本检测网络,使用分水岭算法生成 label,采用 heatmap 得到激活值最大的目标区域。

支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别

Easy OCR 使用了 CRAFT 文本检测器的官方 Pytorch 实现。

CRAFT 实现地址:https://github.com/clovaai/CRAFT-pytorch

在处理过程中,Easy OCR 对输入图像中的每一行文字提供 [location, text, model confident] 结果,如下图所示:

支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别

对于给定图像,Easy OCR 分别对图像中的每一行文字提供 [location, text, model confident] 结果。

此外,使用者还可以在不同的数据集上对模型进行重新训练,不过目前项目作者尚未放出训练脚本。开发者可以参考该库 https://github.com/clovaai/deep-text-recognition-benchmark 进行模型重训练。

关于 Easy OCR 的更多细节及代码详情,参见 GitHub 项目地址。

文为机器之心报道, 转载请联系本公众号获得授权

支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别

PyTorch  入门与实战课程开课啦。

16个小时 手把手 带你实现课程中的项目,玩转 PyTorch1.0

支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别

扫描二维码,99元一键开团!

:point_down::point_down::point_down:

支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别

✄------------------------------------------------

看到这里,说明你喜欢这篇文章,请点击「 在看 」或顺手「 转发 」「 点赞 」。

欢迎微信搜索「 panchuangxx 」,添加小编 磐小小仙 微信,每日朋友圈更新一篇高质量推文(无广告),为您提供更多精彩内容。

▼       扫描二维码添加小编   ▼    ▼  

支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

算法导论(原书第2版)

算法导论(原书第2版)

[美] Thomas H.Cormen、Charles E.Leiserson、Ronald L.Rivest、Clifford Stein / 潘金贵 等 / 机械工业出版社 / 2006-9 / 85.00元

这本书深入浅出,全面地介绍了计算机算法。对每一个算法的分析既易于理解又十分有趣,并保持了数学严谨性。本书的设计目标全面,适用于多种用途。涵盖的内容有:算法在计算中的作用,概率分析和随机算法的介绍。书中专门讨论了线性规划,介绍了动态规划的两个应用,随机化和线性规划技术的近似算法等,还有有关递归求解、快速排序中用到的划分方法与期望线性时间顺序统计算法,以及对贪心算法元素的讨论。此书还介绍了对强连通子图......一起来看看 《算法导论(原书第2版)》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具