文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

【Python • 图片识别】pytesseract快速识别提取图片中的文字

2023-09-10 21:12

关注

在这里插入图片描述

提示:本文多图,请手机端注意流量。

文章目录


利用python做图片识别,识别提取图片中的文字会有很多方法,但是想要简单一点怎么办,那就可以使用tesseract识别引擎来实现,一行代码就可以做到提取图片文本。


1. 安装python依赖

本程序用到了两个python库,pytesseract和PIL,所以先来安装。

运行以下命令

pip install Pillowpip install pytesseract 

如果在python中没有报错,说明程序安装成功,
在这里插入图片描述

2. 安装识别引擎

安装完以上两个依赖还需要对应的识别引擎。点击去下载

咱们直接使用5月10号构建的最新版本。
在这里插入图片描述

安装tesseract识别引擎(可跳过)

下载完成后打开程序进行安装,先选择语言,这里选择英语English就行,然后点ok

在这里插入图片描述
接下来就是next,完了点击I Agree同意协议,
在这里插入图片描述
在这里插入图片描述
为所有用户安装,然后点next,如图,
在这里插入图片描述
接下来安装中文的语言包用来识别中文,需要滑到下面,选择中文,我这里横排简体中文和竖排简体中文都选择了,完成后点击next,
在这里插入图片描述
在这里插入图片描述
选择安装路径,建议安装到C盘以外,然后点击next
在这里插入图片描述
这里点击安装install

在这里插入图片描述
等待安装完成
在这里插入图片描述
安装完成后,点击next,再点击finish完成安装,
在这里插入图片描述
在这里插入图片描述

验证是否安装成功

添加环境变量,就是你安装到的那个文件夹路径,直接加到path里面,
在这里插入图片描述
然后在命令行运行tesseract -v,如果和下图一样,说明你已经安装成功了,
在这里插入图片描述

1.引入库

from PIL import Imageimport pytesseract

2.提取图片文字

将读取图片的一行代码封装为一个函数,

def read_image(name):    print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))

main函数中直接调用即可,

def main():    read_image('1657158527412.jpg')

3.运行效果

以以下图片为例,
在这里插入图片描述

运行效果如下,
在这里插入图片描述


本文介绍了tesseract的python调用,也就是pytesseract库,其中还有一些其他的内容并没有涉及,仅涉及到了图片提取文字,如果你对其感兴趣,可以深入探索一下,也希望能和我探讨一下。

from PIL import Imageimport pytesseractdef read_image(name):    print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))def main():    read_image('img.png')if __name__ == '__main__':    main()

来源地址:https://blog.csdn.net/weixin_47754149/article/details/125651707

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯