8.6M超轻量中英文OCR模型开源，训练部署一条龙

发布时间：2020-07-19 11:24:52 所属栏目：模式来源：站长网

导读：副标题#e# 本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。要说生活里最常见、最便民的AI应用技术，OCR（光学字符识别）当属其中之一。寻常到日常办理各种业务时的身份证识别，前沿到自动驾驶车辆的路牌识别，都少不了它的加持。作

为了方便开发者使用自己的数据自定义超轻量模型，除了8.6M超轻量模型外，PaddleOCR同时提供了2种文本检测算法（EAST、DB）、4种文本识别算法（CRNN、Rosseta、STAR-Net、RARE），基本可以覆盖常见OCR任务的需求，并且算法还在持续丰富中。

特别是「模型训练/评估」中的「中文OCR训练预测技巧」，更是让人眼前一亮，点进去可以看到「中文长文本识别的特殊处理、如何更换不同的backbone等业务实战技巧」，相当符合开发者项目实战中的炼丹需求。

8.6M超轻量中英文OCR模型开源，训练部署一条龙 | Demo在线可玩打通预测部署全流程

对开发者更友好的是，PaddleOCR提供了手机端（含iOS、Android Demo）、嵌入式端、大规模数据离线预测、在线服务化预测等多种预测工具组件的支持，能够满足多样化的工业级应用场景。

8.6M超轻量中英文OCR模型开源，训练部署一条龙 | Demo在线可玩数据集汇总

项目帮开发者整理了常用的中文数据集、标注和合成工具，并在持续更新中。

目前包含的数据集包括：

5个大规模通用数据集（ICDAR2019-LSVT，ICDAR2017-RCTW-17，中文街景文字识别，中文文档文字识别，ICDAR2019-ArT）大规模手写中文数据集（中科院自动化研究所-手写中文数据集）垂类多语言OCR数据集（中国城市车牌数据集、****信用卡数据集、验证码数据集-Captcha、多语言数据集）

还整理了常用数据标注工具（labelImg、roLabelImg、labelme）、常用数据合成工具（text_renderer、SynthText、SynthText_Chinese_version、TextRecognitionDataGenerator、SynthText3D、UnrealText）

并且开源以来，受到开发者的广泛关注，已经有大量开发者投入到项目的建设中并且贡献内容。

8.6M超轻量中英文OCR模型开源，训练部署一条龙 | Demo在线可玩

真·干货满满。

8.6M超轻量中英文OCR模型开源，训练部署一条龙 | Demo在线可玩体验一下？

看到这里，你心动了吗？如果还想眼见为实，PaddleOCR已经提供了在线Demo，网页版、手机端均可尝试。

感兴趣的话收好下面的传送门，亲自体验起来吧~

传送门：

项目地址：https://github.com/PaddlePaddle/PaddleOCR

网页版Demo：https://www.paddlepaddle.org.cn/hub/scene/ocr

移动端Demo：

https://ai.baidu.com/easyedge/app/openSource?from=paddlelite

（编辑：淮北站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页