首页 > 新闻 > 正文
图片转文字工具(什么软件可以将扫描出来的图片,自动转成文本格式?有哪些软件推荐)

 2022-09-02 11:28  阅读 15

摘要:这里以Python为例,简单介绍一下,如何从图片中识别文字,主要用到Tesseract这个开源软件,感兴趣的朋友可以尝试一下: 01 安装Tesseract 这个直接到官网下载即可,Tesseract是谷歌一个非

这里以Python为例,简单介绍一下,如何从图片中识别文字,主要用到Tesseract这个开源软件,感兴趣的朋友可以尝试一下:

01

安装Tesseract

这个直接到官网下载即可,Tesseract是谷歌一个非常著名、开源的OCR识别引擎,可以轻松识别图片中的任何文字,包括中文、英文等,Windows是一个exe文件,直接双击安装即可,如下,32位、64位都有,选择适合自己平台的版本就行:

安装时候,建议勾选“中文简体”和“中文繁体”这2项,这样在识别中文的时候,才能更好的支持,准确率也会有所提升:

02

识别图片文字

Tesseract安装完成后,这里还需要先安装pytesseract模块,直接在cmd窗口运行命令“pip install pytesseract”即可,程序会自动检测相关依赖并安装,接着我们就可以直接编程调用Tesseract识别图片文字了,测试代码如下,这里包括英文和中文图片识别,基本思路先读取图片,然后加载tesseract,最后再直接调用image_to_string函数识别即可:

程序运行截图如下,第一幅图为英文识别效果,准确率还是非常高的,第二幅图是中文识别效果,效果有些不理想,个别文字存在较大误差,需要改进和优化:

至此,我们就完成了利用Python从图片中识别文字。总的来说,整个过程非常简单,借助于Tesseract,我们可以快速从图片中提取文字,只要你熟悉一下上面的操作过程,很快就能掌握的,网上也有相关教程和资料,介绍的非常详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。

关键字: 什么 / 出来 / 扫描 / 文字 / 软件 / 图片 / 可以 / 工具 / 
舱外维修工具再度升级!航天员出舱维修更加得心应手 百科知识大全(百科知识有哪些) 扩大高质量内容供给 电磁流量计的接线方式以及确定口径的方法-恒大百科 饿了么免单8.30答案今天饿了么免单时间都在下午 黄帝陵简介(黄帝陵在中国哪个位置) LG将在IFA2022展示97英寸OLED电视 聚焦新媒体、新平台的社会责任 欧尚X5PLUS年轻运动SUV新爱豆1.5T动力足 华为nova7se和nova6哪个好华为nova7se参数和nova6区别对比

本站涵盖的内容、图片、视频等模板演示数据,部分未能与原作者取得联系。若涉及版权问题,请及时通知我们并提供相关证明材料,我们将及时予以删除!谢谢大家的理解与支持!


Copyright © 版权所有 | 联系方式:osnev93x5o@gmail.com