原创 它会不会成为 OCR 领域霸主?

发布时间:2021-08-02 09:54:42 浏览 2104 来源:猿笔记 作者:TrueDei

    `如果摘要`里提及的内容个关键点并`不是自己想要的`:`她`的识别效果有如下,`只要是文字就能给你检测出来`。`精度`肯定也没的说,`她`现在已经支持`汉语、英语、日语、德语、法语等等语言`的`识别`。`她`关键还有`直接操作式`的`网页版`和`移动版`,`没编程基础`。`没开发环境`也`能`让你`轻松使用`,`方便`、`简单`、`实用`、`识别的还贼快`,`光说不练假把式`下面就具体介绍下OCR以及PaddleOCR的优越性能和`开发`一个`简单的示例`使用步骤。


    我们团队在题目的允许上,去寻找开源的OCR识别算法的模型,在github上有AdvancedEAST和AttentionOCR算法,知名度还是比较高的,还有EasyOCR,还有PaddleOCR。

    最近在“中国软件杯”参加了一个与OCR识别相关的比赛。

    竞赛链接:

    * *一些要求如下:* *

    手撕代码怕鸭子。

    经题许可,我们团队搜索了开源的OCR识别算法模型。github上有AdvancedEAST '和AttentionOCR '算法,大家都很熟悉,EasyOCR '和PaddleOCR '。本文对这些OCR识别算法模型进行了分析,得出了一些结论,选择了一个准确率较高,需要继续往下看的模型。

    想了解一个东西,首先要看它是如何工作的。就像看报纸一样。一定要先看摘要。如果摘要里说的重点不是你想要的,那就没必要往下看。

    “她”的识别效果如下:

    识别效果图

    她`不管你是`侧身'、`直立'还是`标点符号';只要写出来,就可以给你检测出来,”“准确度”肯定没提,大多在‘0.98’以上。

    她现在支持中文、英文、日文、德文、法文等语言的识别。

    她还有“直接操作”“网页版”“手机版”“没有编程基础”“没有开发环境”“能让你“好用”。

    移动终端识别效果图

    网页版本识别效果图

    不得不承认,这个开源项目真的是个好产品。这就是“效果大”、“方便”、“简单”、“实用”、“识别快”。真的。

    哈哈,`她看起来很棒吧?

    但是看了这么多,你还是不知道我说的是谁。你赶时间吗?

    她戴着神秘的面纱。让我们慢慢揭开这个神秘的面纱。

    `她`就是百度开源的`PaddleOCR`项目。

    不练招数就随便说说吧。下面详细介绍一下OCR和PaddleOCR的优越性能以及“开发”一个“简单例子”的步骤。

    * *我们的条目(PPT演示的一部分):* *

    PPT可能做的不是很好。如果你有任何问题,就问他们。呵呵,多交流!

    真的很牛逼。‘PaddleOCR’搭配自己写的‘NLP’,简直无敌!

    当然现在还在比赛阶段,不方便别人公开。如果你想要源代码等资料,我可以在游戏结束后提供,在我的邮箱里留言,或者加我的粉丝群等我上传。

    ##(一)什么是OCR

    光学字符识别(OCR)——光学字符识别(OpticalCharacterRecognition,简称OCR)是指对文字材料的图像文件进行分析和识别,获取文字和版面信息的过程。也就是说,图像中的字符被识别并以文本的形式返回。

    # #(二)应用实例

    OCR技术具有丰富的应用场景,包括日常生活中已经广泛应用的垂直类结构化文本识别,如车牌识别、银行卡信息识别、身份证信息识别、火车票信息识别等。此外,一般的OCR技术也应用广泛,比如在视频场景中,OCR技术也是经常用到的。

    ##(三)OCR难点

    -1.技术难点:如`透视'、`缩放'、`弯曲'、`杂乱'、`字体'、`多语言'、`模糊'等。

    -2.OCR应用往往“对接海量数据”,“但需要实时处理数据”;

    -3.而且OCR应用往往部署在移动终端或者嵌入式硬件上,但是终端端的存储空间和计算能力有限,所以对OCR模型的大小和预测速度有很高的要求。

    有那么多困难必须解决,所以有困难就有解决办法——PaddleOCR解决了以上所有问题。你期待了解PaddleOCR吗?

    下面揭开`PaddleOCR`的神秘面目。一起来认识一下`PaddleOCR`。

    # #(一)总结和介绍

    -PaddleOCR是一款超轻量中英文识别模型

    -目标是创建一个丰富、领先且实用的文本识别模型/工具库

    -3.5M实用超轻光学字符识别系统,支持服务器、移动、嵌入式和物联网设备之间的培训和部署

    -支持中英文识别;支持多方向的文本识别,如倾斜和垂直

    -支持GPU、CPU预测

    -可运行于Linux、Windows、MacOS等多种系统

    -用户可以通过PaddleHub直接方便地使用超轻型号,或者使用PaddleOCR开源工具包进行培训

作者信息

TrueDei [等级:3]
发布了 21 篇专栏 · 获得点赞 110 · 获得阅读 13878

相关推荐 更多