文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

基于OpenCV(python)的实现文本分割之垂直投影法

2024-04-02 19:55

关注

在我的上一篇博客中讲述了水平投影法取出文本行图像的实现,在这里将用垂直投影法对文本行的每个字符进行分割。下图是用水平投影法切割的文本行:

在这里插入图片描述

文本分割的原理如下,先用水平投影取出单一文本行,接着使用垂直投影法达到对单个字符进行分割。

代码如下:

import numpy as np 
import cv2 

def get_vvList(list_data):
    #取出list中像素存在的区间
    vv_list=list()
    v_list=list()
    for index,i in enumerate(list_data):
        if i>0:
            v_list.append(index)
        else:
            if v_list:
                vv_list.append(v_list)
                #list的clear与[]有区别
                v_list=[]
    return vv_list

if __name__=='__main__':
    img_bgr=cv2.imread('./testImg/2.png',1)
    if not img_bgr is None:
        img=img_bgr.copy()
        img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
        #二值化
        t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
        '''
        垂直投影为从上往下投射,统计每一列的黑色像素总数
        '''
        rows,cols=binary.shape
        ver_list=[0]*cols
        for j in range(cols):
            for i in range(rows):
                if binary.item(i,j)==0:
                    ver_list[j]=ver_list[j]+1
        '''
        对ver_list中的元素进行筛选,可以去除一些噪点
        '''
        ver_arr=np.array(ver_list)
        ver_arr[np.where(ver_arr<1)]=0
        ver_list=ver_arr.tolist()

        #绘制垂直投影
        img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
        for j in range(cols):
            pt1=(j,rows-1)
            pt2=(j,rows-1-ver_list[j])
            cv2.line(img_white,pt1,pt2,(0,),1)
        cv2.imshow('垂直投影',img_white)
        cv2.waitKey(0)

        #切割单一字符
        vv_list=get_vvList(ver_list)
        for i in vv_list:
            img_ver=img_bgr[:,i[0]:i[-1]]
            cv2.imshow('单一字符',img_ver)
            cv2.waitKey(0)

运行程序,垂直投影图像如下图所示:

在这里插入图片描述

分割的单一字符如下图:

在这里插入图片描述

单个数字已经正确分割出来了。

到此这篇关于基于OpenCV(python)的实现文本分割之垂直投影法的文章就介绍到这了,更多相关OpenCV垂直投影 内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯