8.6M超轻量中英文OCR模型开源,训练部署一条龙
为了方便开发者使用自己的数据自定义超轻量模型,除了8.6M超轻量模型外,PaddleOCR同时提供了2种文本检测算法(EAST、DB)、4种文本识别算法(CRNN、Rosseta、STAR-Net、RARE),基本可以覆盖常见OCR任务的需求,并且算法还在持续丰富中。 特别是「模型训练/评估」中的「中文OCR训练预测技巧」,更是让人眼前一亮,点进去可以看到「中文长文本识别的特殊处理、如何更换不同的backbone等业务实战技巧」,相当符合开发者项目实战中的炼丹需求。
对开发者更友好的是,PaddleOCR提供了手机端(含iOS、Android Demo)、嵌入式端、大规模数据离线预测、在线服务化预测等多种预测工具组件的支持,能够满足多样化的工业级应用场景。
项目帮开发者整理了常用的中文数据集、标注和合成工具,并在持续更新中。 目前包含的数据集包括: 5个大规模通用数据集(ICDAR2019-LSVT,ICDAR2017-RCTW-17,中文街景文字识别,中文文档文字识别,ICDAR2019-ArT) 大规模手写中文数据集(中科院自动化研究所-手写中文数据集) 垂类多语言OCR数据集(中国城市车牌数据集、****信用卡数据集、验证码数据集-Captcha、多语言数据集) 还整理了常用数据标注工具(labelImg、roLabelImg、labelme)、常用数据合成工具(text_renderer、SynthText、SynthText_Chinese_version、TextRecognitionDataGenerator、SynthText3D、UnrealText) 并且开源以来,受到开发者的广泛关注,已经有大量开发者投入到项目的建设中并且贡献内容。 真·干货满满。
看到这里,你心动了吗?如果还想眼见为实,PaddleOCR已经提供了在线Demo,网页版、手机端均可尝试。 感兴趣的话收好下面的传送门,亲自体验起来吧~ 传送门: 项目地址:https://github.com/PaddlePaddle/PaddleOCR 网页版Demo:https://www.paddlepaddle.org.cn/hub/scene/ocr 移动端Demo: https://ai.baidu.com/easyedge/app/openSource?from=paddlelite
(编辑:淮北站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |