文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

利用yolov5进行目标检测,并将检测到的目标裁剪出来

2023-09-29 22:03

关注

利用yolov5进行目标检测,并将检测到的目标裁剪出来

写在前面:关于yolov5的调试运行在这里不做过多赘述,有关yolov5的调试运行请看:https://www.bilibili.com/video/BV1tf4y1t7ru/spm_id_from=333.999.0.0&vd_source=043dc71f3eaf6a0ccb6dada9dbd8be37
本文章主要讲解的是裁剪。

需求:识别图片中的人物并将其裁剪出来

如果只需识别人物的话,那么只需在yolov5中设定参数即可,例如使用命令行运行时:python --classes 0
即为将参数设置为只识别人。此外需要将检测到的目标裁剪出来还需要目标的中心点坐标以及目标的宽高,因此需要保存目标的信息。实现人物检测并保存检测到的目标信息,运行命令为:python --classes0 --save-txt
在保存目标信息的tx文件中,例如下图:0 0.682078 0.495935 0.613014 0.99187,从左到右以此代表:目标类型(0代表person)、目标中心点坐标的x值(x_center),目标中心点坐标的y值(y_center),目标的宽度(width),目标的高度(height)。
在这里插入图片描述
在这里插入图片描述
要进行裁剪的条件是需要得到x1,x2,y1,y2。很显然

x1=x_center-width/2x2=x_center+width/2y1=y_center-height/2y2=y_center+height/2

但是由于yolov5的txt文件中存储的x_center,y_center,width,height都是经过归一化处理的所以,上述公式中所计算得到的x1,x2,y1,y2值都是经过归一化处理之后的值,我们要的是原值,所以

x1=(x_center-width/2)*整张图片的宽度(注:是整张图片的宽度不是目标的宽度,这里的宽度就是像素宽度)x2=(x_center+width/2)*整张图片的宽度y1=(y_center-height/2)*整张图片的高度(注:是整张图片的高度不是目标的高度,这里的高度就是像素高度)y2=(y_center+height/2)*整张图片的高度

得到了x1,x2,y1,y2四个值,那在水平方向上裁剪x1---->x2,在垂直方向上裁剪y1---->y2,即可。
代码实现:

import osimport cv2def main():#图片路径    img_path = './data/images/hg.jpg'    #txt文件路径    label_path = './runs/detect/exp23/labels/hg.txt'    # 读取图片,结果为三维数组    img = cv2.imread(img_path)    # 图片宽度(像素)    w = img.shape[1]    # 图片高度(像素)    h = img.shape[0]    # 打开文件,编码格式'utf-8','r+'读写    f = open(label_path, 'r+', encoding='utf-8')      # 读取txt文件中的第一行,数据类型str    line = f.readline()    # 根据空格切割字符串,最后得到的是一个list    msg = line.split(" ")    x1 = int((float(msg[1]) - float(msg[3]) / 2) * w)  # x_center - width/2    y1 = int((float(msg[2]) - float(msg[4]) / 2) * h)  # y_center - height/2    x2 = int((float(msg[1]) + float(msg[3]) / 2) * w)  # x_center + width/2    y2 = int((float(msg[2]) + float(msg[4]) / 2) * h)  # y_center + height/2    print(x1, ",", y1, ",", x2, ",", y2)    #裁剪    img_roi = img[y1:y2,x1:x2]    save_path='./cutpictures/hg.jpg'    cv2.imwrite(save_path,img_roi)if __name__ == '__main__':      main() 

效果展示:
目标检测
请添加图片描述
裁剪
请添加图片描述
写在后面:在上面的代码实现中,因为我已经知道了在图片中只有一个person,所以txt文件中只有一行,所以我只用f.readlin()读取了一行,如果有多个目标person,那就用f.readlines()读取多行,再用for循环一行一行去裁剪即可。

更正:在后续的操作中我想把图片中最远的人裁剪出来,也就是下图的红框,那只需比较y_center,把y_center最大的裁剪出来即可,按照此想法我裁剪出来的却是绿框。
在这里插入图片描述
后来验证发现yolov中的坐标系如下:
在这里插入图片描述
但是并不影响对上面相关过程的理解。

来源地址:https://blog.csdn.net/weixin_44747173/article/details/127277989

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯