哈喽大家好,这里是滑稽研究所。看过我们图像处理系列的朋友,应该知道识别答题卡那期文章。其中利用opencv框架,完美的实现了答题卡填涂区域的识别。在后台有小伙伴想要我完善一下判断选项对错并打分的功能,本期我们就来实现一下。
那么我们来复习一下往期的代码原理。我们需要对图片素材进行灰度化处理、透视变换、轮廓检测、腐蚀膨胀处理、区域分割、边框计算、区域计算。实际上我们是通过像素面积的过滤、填涂区域优化和获取选项坐标来完成答题卡的识别的。
素材:
那么在获取到答题卡的填涂区域之后就好办了。我们首先分隔答题卡,去除干扰项,然后把不同的区域打上标签。我们的答题卡是自上而下排序的。那么我们获取到的填涂项的x坐标即横坐标就派上了用场。选项A~E一定是占据了五个不同的区域。我们已经为不同区域打上了标签。剩下的就是交给我们的if判断语句了。这时我们已经为填涂项赋上了实际的意义。即从像素坐标转换成了具有实际意义的选项。
那y坐标就没有用了吗?非也。经过上面的处理我们只是得到了填涂区域对应的选项。但是我们还没有进行排序。大家知道无序的选项是没有意义的。而刚刚我们说了该答题卡的题号顺序是自上而下的。因为我们遍历选项时,是同时得到x、y坐标的,因此我们可以保证得到的坐标是配对的。
其中横纵坐标分别填入两个list中,然后使用zip方法合并list。这时我们再按照每个list的第二个元素也就是纵坐标进行由小到大的排序,就可以得到正确的顺序。
这时我们才真正获取到了需要的数据。即考生填涂的选项顺序,我们再新建一个list放正确的答案,与考生的答案进行对比,经计算得出考生的正确率,并给出分数。
好,思路清晰,上代码!
import cv2
import numpy as np
path = './test_01.png'
img = cv2.imread(path)
imgGray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
imgBlur = cv2.GaussianBlur(imgGray,(3,3),1)
imgCanny = cv2.Canny(imgBlur,100,120)
cv2.imshow("O", imgCanny)
imgContour = img.copy()
cnts = cv2.findContours(imgCanny, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)[0]
for cnt in cnts:
area = cv2.contourArea(cnt)
# 这个输出各个轮廓的面积
#print(area)
#
if area >= 500:
cv2.drawContours(imgContour, cnt, -1, (255, 0, 0), 3)
peri = cv2.arcLength(cnt, True)
# 找出轮廓的突变值
approx = cv2.approxPolyDP(cnt, 0.02 * peri, True)
# approx找到的是一个轮廓有几个突变值,有几个角就会有几个突变值
# 返回的是一个list,输出他的长度,就可以知道到底有几个角
#print(approx)
a1,a2,a3,a4 = list(approx[0][0]),list(approx[1][0]),list(approx[2][0]),list(approx[3][0])
#cv2.imshow("Canny Image",imgContour)
mat1 = np.array([a1,a2,a3,a4],dtype=np.float32)
#透视变换
#计算矩形宽高
width = 402#int(((a4[0]-a1[0])+(a3[0]-a2[0]))/2)
height = 518#int(((a2[1]-a1[1])+(a3[1]-a4[1]))/2)
#计算还原后的坐标
new_a1 = [0,0]
new_a2 = [0,height]
new_a3 = [width,height]
new_a4 = [width,0]
mat2 = np.array([new_a1,new_a2,new_a3,new_a4],dtype=np.float32)
#计算变换矩阵
mat3 = cv2.getPerspectiveTransform(mat1,mat2)
#进行透视变换
res = cv2.warpPerspective(imgCanny,mat3,(width,height))
res1 = cv2.warpPerspective(img,mat3,(width,height))
imgxx = cv2.cvtColor(res1,cv2.COLOR_BGR2GRAY)
binary = cv2.threshold(imgxx,0,255,cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU )[1]
#变换完成
#cv2.imshow("Output",res1)
cntss = cv2.findContours(res, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)[0]
for cnt1 in cntss:
area1 = cv2.contourArea(cnt1)
# 这个输出各个轮廓的面积
#print(area)
#
if area1 >= 1500 and area1<=1700:
#把圆的轮廓画成黑色
cv2.drawContours(binary, cnt1, -1, (0, 0, 0), 10)
kernel = np.ones((5, 5), np.uint8)
imgDialation = cv2.dilate(binary, kernel, iterations=1)
cv2.imshow("Out", imgDialation)
cntsss = cv2.findContours(imgDialation, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)[0]
l1 = []
l2 = []
l3 = ['B','E','A','D','B']
for cnt2 in cntsss:
area2 = cv2.contourArea(cnt2)
#print(area)
if area2 <= 1200 and 800<=area2:
#cv2.drawContours(res1, cnt, -1, (0, 255, 0), 5)
#轮廓长
peri = cv2.arcLength(cnt2, True)
# 找出轮廓的突变值
approx1 = cv2.approxPolyDP(cnt2, 0.02 * peri, True)
x, y, w, h = cv2.boundingRect(approx1)
#外接矩形
#print(x+w//2,y+h//2)
m = x+w//2
n = y+h//2
l1.append(m)
l2.append(n)
#拼接两个一维列表,使x,y坐标配对。
mix1 = list(zip(l1,l2))
#按列表第二个元素升序,即按y值由小到大排列。
#这是我们得到的答案为正确顺序。
mix1.sort(key=lambda x: x[1])
if 400>x>80 and 50<y<350:
cv2.rectangle(res1, (x, y), (x + w, y + h), (0, 0, 255), 2)
#圆心
# (图像,x.y位置,半径,颜色,轮廓粗细)
cv2.circle(res1, (x+w//2,y+h//2), 1, (255, 0, 0), 5)
l4 = []
for i in mix1:
if 75 < i[0] < 130:
print("A")
l4.append('A')
elif 130 < i[0] < 185:
print("B")
l4.append('B')
elif 185 < i[0] < 240:
print("C")
l4.append('C')
elif 240 < i[0] < 295:
print("D")
l4.append('D')
elif 295 < i[0] < 350:
print("E")
l4.append('E')
print('正确答案:',l3)
print('考生答案',l4)
h = 0
for i in range(0, len(l3)):
if l3[i] == l4[i]:
h=h+1
print('得分:',str(h/5*100)+'分')
cv2.imshow("cc Image",res1)
cv2.imshow("dd Image",binary)
cv2.waitKey(0)
运行结果:
以上为两个图片素材的运行结果,我们只放出其中一部分。剩余的素材大家自行实验。
可以看到,程序成功的识别了考生填涂的答题卡,并给出了考生答案、正答案和考生最后的得分。
综上功能实现,任务完成。大家学会了吗?
以上就是Python识别答题卡并给出分数的详细内容,更多关于Python识别答题卡的资料请关注编程网其它相关文章!