文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

labelimg标注的VOC格式标签xml文件和yolo格式标签txt文件相互转换

2023-09-09 12:31

关注

目录

1 labelimg标注VOC格式和yolo格式介绍

1.1 voc格式

1.2 yolo数据格式介绍

2 voc格式数据和yolo格式数据相互转换

2.1 voc转yolo代码

2.2 yolo转voc格式代码 


        labelimg标注工具怎么安装和使用在我的博客中已经讲解了,有需要可以看看,博客

1.1 voc格式

        VOC格式文件保存在和图像名称一样的xml文件中,xml文件中的标注信息如下图所示:文中红色框中保存着标注图片的主要信息。第一个红色框中里面显示着图片的保存在哪个文件夹中,标签对应的图片名称,还有图片保存的绝对路径。第二个红色框中的信息为标签图片的大小尺寸和通道,正常都是3通道。第三个红色框中的信息为图中标注的对象的信息,分别为该目标对象的属于哪一类,可以看出该对象名称为boat,然后还有标注框的两个点,分别为框的起始点和终结点。第四个红色框中的信息和第三个框框一样,都是我们标注对象的信息,不过该对象为cat。

1.2 yolo数据格式介绍

        yolo数据格式,是把每个图片的标注信息保存在一个和图片名称一样的txt文件中。txt文件中的信息如下图所示:

0 0.47416020671834624 0.4523809523809524 0.5968992248062015 0.6839826839826841 0.874031007751938 0.4069264069264069 0.1227390180878553 0.2727272727272727

        每一行代表标注的一个目标,第一个数字代表着这个数的类别,第一类目标就是0,第二类目标就是1,以此类推。后面的四个数字是归一化后的的标注的中心点坐标和归一化标注框的长和宽。

2.1 voc转yolo代码

import xml.etree.ElementTree as ETimport pickleimport osfrom os import listdir, getcwdfrom os.path import joindef convert(size, box):    x_center = (box[0] + box[1]) / 2.0    y_center = (box[2] + box[3]) / 2.0    x = x_center / size[0]    y = y_center / size[1]    w = (box[1] - box[0]) / size[0]    h = (box[3] - box[2]) / size[1]    return (x, y, w, h)def convert_annotation(xml_files_path, save_txt_files_path, classes):    xml_files = os.listdir(xml_files_path)    print(xml_files)    for xml_name in xml_files:        print(xml_name)        xml_file = os.path.join(xml_files_path, xml_name)        out_txt_path = os.path.join(save_txt_files_path, xml_name.split('.')[0] + '.txt')        out_txt_f = open(out_txt_path, 'w')        tree = ET.parse(xml_file)        root = tree.getroot()        size = root.find('size')        w = int(size.find('width').text)        h = int(size.find('height').text)        for obj in root.iter('object'):            difficult = obj.find('difficult').text            cls = obj.find('name').text            if cls not in classes or int(difficult) == 1:                continue            cls_id = classes.index(cls)            xmlbox = obj.find('bndbox')            b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),                 float(xmlbox.find('ymax').text))            # b=(xmin, xmax, ymin, ymax)            print(w, h, b)            bb = convert((w, h), b)            out_txt_f.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')if __name__ == "__main__":    # 需要转换的类别,需要一一对应    classes1 = ['boat', 'cat']    # 2、voc格式的xml标签文件路径    xml_files1 = r'C:\Users\86159\Desktop\VOC2007\Annotations'    # 3、转化为yolo格式的txt标签文件存储路径    save_txt_files1 = r'C:\Users\86159\Desktop\VOC2007\label'    convert_annotation(xml_files1, save_txt_files1, classes1)

         需要注意的是一定要将自己的类别名字写对,对应好,否则会出错。

2.2 yolo转voc格式代码 

from xml.dom.minidom import Documentimport osimport cv2# def makexml(txtPath, xmlPath, picPath):  # txt所在文件夹路径,xml文件保存路径,图片所在文件夹路径def makexml(picPath, txtPath, xmlPath):  # txt所在文件夹路径,xml文件保存路径,图片所在文件夹路径    """此函数用于将yolo格式txt标注文件转换为voc格式xml标注文件    在自己的标注图片文件夹下建三个子文件夹,分别命名为picture、txt、xml    """    dic = {'0': "boat",  # 创建字典用来对类型进行转换           '1': "cat",  # 此处的字典要与自己的classes.txt文件中的类对应,且顺序要一致           }    files = os.listdir(txtPath)    for i, name in enumerate(files):        xmlBuilder = Document()        annotation = xmlBuilder.createElement("annotation")  # 创建annotation标签        xmlBuilder.appendChild(annotation)        txtFile = open(txtPath + name)        txtList = txtFile.readlines()        img = cv2.imread(picPath + name[0:-4] + ".jpg")        Pheight, Pwidth, Pdepth = img.shape        folder = xmlBuilder.createElement("folder")  # folder标签        foldercontent = xmlBuilder.createTextNode("driving_annotation_dataset")        folder.appendChild(foldercontent)        annotation.appendChild(folder)  # folder标签结束        filename = xmlBuilder.createElement("filename")  # filename标签        filenamecontent = xmlBuilder.createTextNode(name[0:-4] + ".jpg")        filename.appendChild(filenamecontent)        annotation.appendChild(filename)  # filename标签结束        size = xmlBuilder.createElement("size")  # size标签        width = xmlBuilder.createElement("width")  # size子标签width        widthcontent = xmlBuilder.createTextNode(str(Pwidth))        width.appendChild(widthcontent)        size.appendChild(width)  # size子标签width结束        height = xmlBuilder.createElement("height")  # size子标签height        heightcontent = xmlBuilder.createTextNode(str(Pheight))        height.appendChild(heightcontent)        size.appendChild(height)  # size子标签height结束        depth = xmlBuilder.createElement("depth")  # size子标签depth        depthcontent = xmlBuilder.createTextNode(str(Pdepth))        depth.appendChild(depthcontent)        size.appendChild(depth)  # size子标签depth结束        annotation.appendChild(size)  # size标签结束        for j in txtList:            oneline = j.strip().split(" ")            object = xmlBuilder.createElement("object")  # object 标签            picname = xmlBuilder.createElement("name")  # name标签            namecontent = xmlBuilder.createTextNode(dic[oneline[0]])            picname.appendChild(namecontent)            object.appendChild(picname)  # name标签结束            pose = xmlBuilder.createElement("pose")  # pose标签            posecontent = xmlBuilder.createTextNode("Unspecified")            pose.appendChild(posecontent)            object.appendChild(pose)  # pose标签结束            truncated = xmlBuilder.createElement("truncated")  # truncated标签            truncatedContent = xmlBuilder.createTextNode("0")            truncated.appendChild(truncatedContent)            object.appendChild(truncated)  # truncated标签结束            difficult = xmlBuilder.createElement("difficult")  # difficult标签            difficultcontent = xmlBuilder.createTextNode("0")            difficult.appendChild(difficultcontent)            object.appendChild(difficult)  # difficult标签结束            bndbox = xmlBuilder.createElement("bndbox")  # bndbox标签            xmin = xmlBuilder.createElement("xmin")  # xmin标签            mathData = int(((float(oneline[1])) * Pwidth + 1) - (float(oneline[3])) * 0.5 * Pwidth)            xminContent = xmlBuilder.createTextNode(str(mathData))            xmin.appendChild(xminContent)            bndbox.appendChild(xmin)  # xmin标签结束            ymin = xmlBuilder.createElement("ymin")  # ymin标签            mathData = int(((float(oneline[2])) * Pheight + 1) - (float(oneline[4])) * 0.5 * Pheight)            yminContent = xmlBuilder.createTextNode(str(mathData))            ymin.appendChild(yminContent)            bndbox.appendChild(ymin)  # ymin标签结束            xmax = xmlBuilder.createElement("xmax")  # xmax标签            mathData = int(((float(oneline[1])) * Pwidth + 1) + (float(oneline[3])) * 0.5 * Pwidth)            xmaxContent = xmlBuilder.createTextNode(str(mathData))            xmax.appendChild(xmaxContent)            bndbox.appendChild(xmax)  # xmax标签结束            ymax = xmlBuilder.createElement("ymax")  # ymax标签            mathData = int(((float(oneline[2])) * Pheight + 1) + (float(oneline[4])) * 0.5 * Pheight)            ymaxContent = xmlBuilder.createTextNode(str(mathData))            ymax.appendChild(ymaxContent)            bndbox.appendChild(ymax)  # ymax标签结束            object.appendChild(bndbox)  # bndbox标签结束            annotation.appendChild(object)  # object标签结束        f = open(xmlPath + name[0:-4] + ".xml", 'w')        xmlBuilder.writexml(f, indent='\t', newl='\n', addindent='\t', encoding='utf-8')        f.close()if __name__ == "__main__":    picPath = "C:/Users/86159/Desktop/VOC2007/JPEGImage/"  # 图片所在文件夹路径,后面的/一定要带上    txtPath = "C:/Users/86159/Desktop/VOC2007/yolo/"  # txt所在文件夹路径,后面的/一定要带上    xmlPath = "C:/Users/86159/Desktop/VOC2007/Annotations1/"  # xml文件保存路径,后面的/一定要带上    makexml(picPath, txtPath, xmlPath)

        需注要意的是一定要将类别和名字对应好

来源地址:https://blog.csdn.net/didiaopao/article/details/119910139

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯