文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

python进阶——AI视觉实现口罩检测实时语音报警系统

2023-08-31 10:29

关注

  大家好,我是csdn的博主:lqj_本人

这是我的个人博客主页:lqj_本人的博客_CSDN博客-微信小程序,前端,vue领域博主lqj_本人擅长微信小程序,前端,vue,等方面的知识https://blog.csdn.net/lbcyllqj?spm=1000.2115.3001.5343

哔哩哔哩欢迎关注:小淼前端

小淼前端的个人空间_哔哩哔哩_bilibili

本篇文章主要讲述python的人工智能视觉模块的口罩检测实时语音检测报警系统,本篇文章已经成功收录到我们python专栏中:https://blog.csdn.net/lbcyllqj/category_12089557.htmlicon-default.png?t=N0U7https://blog.csdn.net/lbcyllqj/category_12089557.html

目录

 前言

项目介绍

PaddlenHub模块

使用时可能遇到的bug

解决方法

方法解释

playsound模块

项目思路

代码详解

完整代码及注释

效果展示(不带口罩时会有重复语音警告)


 

本程序主要实现了python的opencv人工智能视觉模块的口罩检测实时语音检测报警。

若不知道怎么安装opencv或者使用的请看我的这篇文章(曾上过csdn综合热榜的top1):

python进阶——人工智能视觉识别_lqj_本人的博客-CSDN博客

同时,另一篇基于opencv的人工智能视觉实现的目标实时跟踪功能(增上过csdn综合热榜的top5):

python进阶——人工智能实时目标跟踪_lqj_本人的博客-CSDN博客

PaddlenHub模块

PaddleHub飞桨预训练模型管理和迁移学习工具,通过PaddleHub开发者可以使用高质量的预训练模型结合Fine-tune API快速完成迁移学习到应用部署的全流程工作。其提供了飞桨生态下的高质量预训练模型,涵盖了图像分类、目标检测、词法分析、语义模型、情感分析、视频分类、图像生成、图像分割、文本审核、关键点检测等主流模型。

使用时可能遇到的bug

AttributeError: partially initialized module ‘cv2‘ has no attribute ‘gapi_wip_gst_GStreamerPipeline‘

bug显示:cv2没有指定的依赖。

解决方法

在我们的pycharm中自带的命令窗口中输入:

pip install opencv-python install "opencv-python-headless<4.3"

然后,我们再把我们的opencv-python降低版本为与我们安装的opencv-python-headless版本相同即可,我这里用的都是4.2.0.34版本。

 方法解释

因为opencv4.3以上的版本会存在与其他模块依赖的兼容性问题,4.3以上的版本兼容性较差,所以,有时会出现一下bug之类的错误。有时,其实我们写的代码没有问题,只是问题出在了依赖的兼容性问题上!

playsound模块

PlaySound是Windows用于播放音乐的API函数(方法)。在vs2010以上版本需要加入#pragma comment(lib, "winmm.lib")才能使用PlaySound。PlaySound函数原型为 BOOL PlaySound(LPCSTR pszSound, HMODULE hmod,DWORD fdwSound)。PlaySound参数,pszSound是指定了要播放声音的字符串,该参数可以是WAVE文件的名字,或是WAV资源的名字,或是内存中声音数据的指针,或是在系统注册表WIN.INI中定义的系统事件声音。如果该参数为NULL则停止正在播放的声音。

使用PaddlenHub模块指定算法,根据面部特征的上下左右来判断是否面部有物体遮挡,并判断遮挡区域及位置,若判断条件成功,则绘制绿色矩形及英文提示。若判断条件失败,则绘制红色矩形及英文提示!

使用playsound模块指定我们录制好的MP3文件,当判断条件符合时,则按照playsound模块原生函数播放MP3文件,达到语音警告提示效果!

首先导入相应模块

import paddlehubimport cv2from playsound import playsound

指定paddlehub模块中的算法并赋值

module=paddlehub.Module(name="pyramidbox_lite_mobile_mask")

调用本机摄像头

cap=cv2.VideoCapture(0)

循环判断指定位置及遮挡区域

while(cap.isOpened()):    frame = cap.read()[1]    input_dict = {'data':[frame]}    results = module.face_detection(data=input_dict)    result = results[0]

 设置绑定键盘按压事件

    k = cv2.waitKey(1) & 0xFF  # 判断按键

判断肯定条件时绿色字体和矩形

 if result['data']!=[]:        label = result['data'][0]['label']        left = result['data'][0]['left']        right = result['data'][0]['right']        top = result['data'][0]['top']        bottom = result['data'][0]['bottom']        color = (0,255,0)        color2 = (0,255,0)

判断否定条件时红色字体和矩形,并播放语音警告提示

        if label == 'NO MASK':            color = (0,0,255)            color2 = (0,0,255)            playsound('1.mp3')

 cv2最后的绘制及显示交互窗口

        cv2.rectangle(frame,(left,top),(right,bottom),color,3)        cv2.putText(frame,label,(left,top-10),cv2.FONT_HERSHEY_SIMPLEX,0.8,color2,2)        cv2.imshow('xianshi',frame)

判断监听键盘按压事件

        if k == ord(' '):#退出            break

释放摄像头及内存

#释放摄像头cap.release()#释放内存cv2.destroyAllWindows()
import paddlehubimport cv2from playsound import playsound#指定paddlehub模块的视觉算法module=paddlehub.Module(name="pyramidbox_lite_mobile_mask")#调用本机摄像头cap=cv2.VideoCapture(0)#循环判断面部区域位置while(cap.isOpened()):    frame = cap.read()[1]    input_dict = {'data':[frame]}    results = module.face_detection(data=input_dict)    result = results[0]#绑定键盘监听事件    k = cv2.waitKey(1) & 0xFF  # 判断按键#当判断为肯定时,则绘制绿色矩形及文字    if result['data']!=[]:        label = result['data'][0]['label']        left = result['data'][0]['left']        right = result['data'][0]['right']        top = result['data'][0]['top']        bottom = result['data'][0]['bottom']        color = (0,255,0)        color2 = (0,255,0)        #当判断为否定式绘制红色矩形及文字        if label == 'NO MASK':            color = (0,0,255)            color2 = (0,0,255)            #打开录制的MP3语音文件            playsound('1.mp3')        #cv2最会的绘制及显示        cv2.rectangle(frame,(left,top),(right,bottom),color,3)        cv2.putText(frame,label,(left,top-10),cv2.FONT_HERSHEY_SIMPLEX,0.8,color2,2)        #显示交互窗口        cv2.imshow('xianshi',frame)        #监听键盘事件,并判断是否退出        if k == ord(' '):#退出            break#释放摄像头cap.release()#释放内存cv2.destroyAllWindows()

 

 

来源地址:https://blog.csdn.net/lbcyllqj/article/details/128905097

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯