ocr识别软件哪个好用法语 ocr识别最好的软件



文章插图
ocr识别软件哪个好用法语 ocr识别最好的软件

文章插图
创作立场声明:本人长年热衷于挖掘各种好玩有趣或稀奇古怪的电脑软件和手机 App,写文科生都能看得懂玩得转的玩机教程,期待和大家的深入探讨交流 。
今天来反思一下关于 OCR 这一块的问题 。
5 月底,给大家安利了天若 OCR 的最后一个开源版本 5.0,但我一直心中有愧 。
一方面我的需求没有那么大,把一直用着的天若拉出来其实有点取巧,真正偶尔用一次的情况下,完全可以用 QQ 自带的文字识别 。
另一方面天若那个版本两三年没更新了,作者跑去维护别的项目去了,虽然说是接受百度、搜狗、腾讯、有道四个接口 。
但公共接口挂了两个(腾讯、百度),而真正支持用自己申请的接口只有百度一个 。
看很多小伙伴其实对百度这个接口并不买单,这是我有愧的地方 。
毕竟咱偶尔分享一个应用,就是想让更多人了解到更好用的软件,违背了初衷我可不干 。
好在那次摸索的 OCR 的时候,了解到 PandaOCR 可以支持多个自定义接口 。
怎么说呢,就很强大 。
作者也是个爆肝强人,每逢节假日还在那里更新迭代,比起早早退出舞台的天若 5.0 更值得拿出来说道说道 。
这不,它来了 。
PandaOCR
额,今天介绍的版本是 PandaOCR 2.71 。
这大概是最后一个免费提供多自定义接口的版本了 。
前几天去 GitHub 上翻 PandaOCR 的时候,发现多了个 Pro 版本 。
作者原话,因为前期急着上新功能,结果忽视了执行逻辑混乱以及后续维护成本高的问题 。
换句话说,就是作者把旧版的代码定性成屎山了 。
与其满头大汉(不是错字)的折磨自己,不如重构一遍,跳过那座山,然后就有了 Pro 版 。
这是 PandaOCR Pro 5.32:
可问题是 Pro 版只提供有百度的自定义接口,别的接口都成收费服务了 。
所以,各种意义上说,PandaOCR 2.71 就成了能免费使用的最后一个版本 。
不过作者说啊,这最后一个版本只是不上新功能了,已有的功能接口仍会维护 。
对于绝大部分人来说,这就够了,比如我 。
如果你真心喜欢这个浓眉大眼小熊猫,还是可以给作者支持一波 。
【ocr识别软件哪个好用法语 ocr识别最好的软件】能做什么
一款集大成的 OCR 工具有什么用?
对于文本识别质量而言,那是接口的对比,如果弄不太明白的,可以看看天若 OCR 的那篇文章 。
就识别效果而言,搜狗的准确率高些,百度手写识别的效果更好,有道的识别速度更快,讯飞和 Mathpix 的公式识别更清晰,百度的表格识别也不错 。
所以抛开接口,回归到 PandaOCR 自身,它提供了怎样的方便,才是我们该关心的 。
我们重新认识一下它的界面,左边显示图片,右边则是识别文本和翻译框,外加一个功能栏:
操作起来很方便,默认快捷键「F4」截图,然后就能调用你选择的接口自动识别 。
识别的内容会显示在桌面,以弹窗的形式显示,至于显示的内容,可以在「高级」设置中选择 。
当然,高级设置里能更改更多东西,比如是否监听剪切板,是否自动复制识别的内容,甚至字体、截图方式等等 。
双击 PandaOCR 的识别和翻译那一块,还会有惊喜,打开监听剪切板,分分钟变成一个翻译软件 。
对了,还有个固定截图的功能,简单的说,就是把截图框固定到桌面一处,然后快捷键触发 OCR 识别 。
我看 B 站上已经有人拿它来做游戏机翻工具了,效果是这样的 。
我就不重复造轮子了,感兴趣的可以去研究一下 。
PandaOCR 之所以强大,还是因为它支持的接口多,那它到底能使用什么接口呢?
我从它配置文件里看了一下:
支持通用识别:搜狗 + 腾讯 + 百度 + 有道 + 阿里 + 讯飞 + 网校 + SpaceOCR
支持手写识别:腾讯 + 百度 + 阿里 + 讯飞
支持公式识别:微软(演示)+ 百度 + 腾讯 + Mathpix + 讯飞
支持表格识别:有道(演示)+ 百度 + 腾讯 + 阿里
支持翻译:搜狗 + 腾讯 + 百度 + 有道 + 彩云小译 + DeepL
是不是看的都有些怵的慌,事实上早先版本的接口更多,最后一个版本应该删除了近 20 个接口 。
但设置起来并不麻烦,右键点击左上角的图标,选择「编辑配置」,在文本中更改对应的接口就行 。
至于怎么申请接口,又要放哪里,我这里还是以百度为例,介绍一下 。
申请接口
进入百度 AI 开放平台,注册登录个账号先 。
然后在「人工智能」找到「OCR 文字识别」里的「通用场景文字识别」 。
当然你也可以在这里找到「OCR 文字识别」:
反正流程不变,选择「创建应用」 。
然后「应用名称」和「应用描述」都随便填,记得「应用归属」选择个人 。
最后立即创建,从「应用列表」把 API Key 和 Secret Key 记录下来 。
总结一下申请流程,就是注册登录 – 申请 – 填信息 – 开通 – 复制 ID 和密钥 – 在 Panda 中粘贴-重载配置文件 。
就是中间这个粘贴步骤,PandaOCR 的格式一直是「ID | KEY」,竖线前后都有个空格,最容易出错的就是这里了 。
纵观整个流程,相信我,真的没有你想的那么难 。
我就不光明正大借着申请接口来水字了,再简单说说接口免费额度以及注意事项 。
百度
我以前见过的这种类似的工具,一般给的接口都是百度的 。
无他,实在是百度给的免费额度太多了,通用 OCR 识别的每日额度高达 5 万 。
可惜,这些都成了过往云烟,5 月底的时候百度把额度改成了未实名 200 次/月,实名 1000 次/月 。
所以百度的接口再也不是最香的了,但百度的手写识别还是挺给力的 。
免费额度如下:
通用识别 1000 次/月,高精度通用识别 1000 次/月,表格识别 500 次/月,手写识别 500 次/月,通用翻译免费 。
腾讯
腾讯云在开通识别时,有个营业执照,那个不管它,直接选确定就行 。
还有就是需要自己申请一下密钥(账号信息-访问管理),不过那个腾讯云的翻译,现在好像只能使用 API 参数调用,PandaOCR 应该是用不成了 。
至于免费额度,腾讯云的 OCR + 表格 + 公式接口共用 1000 次/月,翻译 5 百万/月 。
搜狗
搜狗没有免费额度,而是直接按次收费的,能免费用的点在于刚开始送的 100 元新用户注册券 。
而且作者说是得充点钱才能用,我往里充了一块钱,正在白嫖那 100 元的新人福利 。
有道
和搜狗一样是按量收费的,新人福利 50 元 。
阿里
阿里云的 OCR 也是按次收费的,最大的优惠应该是不可重复购买的那个每 500 次 0.01 元了 。
SpaceOCR
每月有 2.5 万次的免费额度,不过是个国外的网站,邮箱注册(亲测 QQ 邮箱可用),看不懂的直接机翻就行 。
网校
也就是好未来,PandaOCR 只提供了好未来 OCR 的接口,没有翻译接口,所以翻译那个就不用添到项目里了 。
免费额度都是每日 100 次,手写也是百次(过去好像是每日 10 万,哭了) 。
讯飞
讯飞的 OCR 识别的免费形式,是 90 天的 10 万次使用,时间到或者用完即止 。
DeepL
不陌生吧,翻译里的 yyds,它家 API 的免费额度为每月 50 个字符 。
但是,亚洲只有个日本,街道那把我给尬住了,所以我放弃了,溜 。
Mathpix
注册登录没啥的,免费额度每月 1000 次的公式识别,但是创建项目时需要 1 美元的手续费,所以这就意味着你得用到信用卡 。
总结
PandaOCR 这个工具,不仅可以像常规 OCR 工具那样截图识别,固定截图和复制翻译的功能给了它更多的可能 。
拿来翻译论文、做机翻工具都可以,而这都源于大厂的提供的接口 。
PandaOCR 就像是一个中间的掮客,把大厂资源汇集一处,带来了全新的可能 。
不过有一说一,现在白嫖大厂资源是越来越难了 。
但要说缺点的话,就是这玩意用起来太复杂了 。
但可能很长一段时间,我的 OCR 工具都不会改了,为了写这一篇文章,我把所有的接口都申请了一遍,不过也算有所得 。
下回碰到更好用的OCR,估计我就转投付费软件的阵营了 。
这一篇到这里就结束了,我们有缘下篇再见咯 。
本文首发于程序员不高兴,未经授权请勿转载!
一如既往感谢各位小伙伴的支持和关注!