您现在的位置是:首页 > 新闻 > 正文

图文识别转文字(什么软件可以将扫描出来的图片,自动转成文本格式?有哪些软件推荐)

2022-09-15 01:13新闻

简介 这里以Python为例,简单介绍一下,如何从图片中识别文字,主要用到Tesseract这个开源软件,感兴趣的朋友可以尝试一下: 01 安装Tesseract 这个直接到官网下载即可,Tesseract是谷歌一个非...

这里以Python为例,简单介绍一下,如何从图片中识别文字,主要用到Tesseract这个开源软件,感兴趣的朋友可以尝试一下:

01

安装Tesseract

这个直接到官网下载即可,Tesseract是谷歌一个非常著名、开源的OCR识别引擎,可以轻松识别图片中的任何文字,包括中文、英文等,Windows是一个exe文件,直接双击安装即可,如下,32位、64位都有,选择适合自己平台的版本就行:

安装时候,建议勾选“中文简体”和“中文繁体”这2项,这样在识别中文的时候,才能更好的支持,准确率也会有所提升:

02

识别图片文字

Tesseract安装完成后,这里还需要先安装pytesseract模块,直接在cmd窗口运行命令“pip install pytesseract”即可,程序会自动检测相关依赖并安装,接着我们就可以直接编程调用Tesseract识别图片文字了,测试代码如下,这里包括英文和中文图片识别,基本思路先读取图片,然后加载tesseract,最后再直接调用image_to_string函数识别即可:

程序运行截图如下,第一幅图为英文识别效果,准确率还是非常高的,第二幅图是中文识别效果,效果有些不理想,个别文字存在较大误差,需要改进和优化:

至此,我们就完成了利用Python从图片中识别文字。总的来说,整个过程非常简单,借助于Tesseract,我们可以快速从图片中提取文字,只要你熟悉一下上面的操作过程,很快就能掌握的,网上也有相关教程和资料,介绍的非常详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。

Tags:什么 / 可以 / 扫描 / 软件 / 出来 / 文字 / 图文 / 识别 / 

互盾数据恢复软件(第三方工程师删除的东西还能恢复吗) 跟我学画画(在什么时候,你觉得自己的老师很神奇) 人教版一年级语文上册(新版小学一年级语文书为什么第一单元就 优师云登录平台登录(优师云如何激活) 经典魂斗罗(经典游戏《魂斗罗》历代的散弹都是什么样子,是不 会计中华网校(中华会计网校整体教学质量怎么样) 植物大战畺尸中文版(有没有破解版手机版的植物大战僵尸中文版 云港通平台(宁波对外名言有书藏古今,港通天下,南昌是什么 梦幻西游加点模拟器(梦幻西游召唤兽怎么加点啊详细点,谢谢了 麻将连连看3d(麻将有几种玩法)