文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

解决python将xml格式文件转换成txt文件的问题(xml.etree方法)

2024-04-02 19:55

关注

概述

先来介绍一下xml格式的文件,从数据分析的角度去看xml格式的数据集,具有以下的优点开放性(能在任何平台上读取和处理数据,允许通过一些网络协议交换xml数据)、简单性(纯文本,能在不同的系统之间交换数据)、结构和内容分离(不同于HTML,数据的显示和数据本身是分开的)、可扩展性(派生出其他标记语言)

问题描述

那么我们在进行数据分析的时候,如何运用xml里面的数据呢?
我们就需要将这类文件转化成其他类型的文件。
(其实我认为说成提取xml的数据组成新的类型文件比较好一点)
就我个人的观点,处理这方面的问题有点类似于网络爬虫,但不同于爬虫的是不需要考虑IP代理地址的问题(反爬确实是一个很难处理的问题)

问题解决方案

xml格式文件显示内容大致如下:

在这里插入图片描述


import os
import sys
import xml.etree.ElementTree as ET
import glob

def xml_to_txt(indir, outdir):
    os.chdir(indir) # indir为xml文件来源的文件夹,outdir为转换的txt文件存储路径
    annotated = os.listdir('.') # 返回包含目录中文件名称的列表
    print(annotated)
    
    for i, file in enumerate(annotated):
        file_save = file.split('.')[0] + '.txt' #split将文件名与后缀名划分开来
        file_txt = outdir + "\\"+file_save
        f_w = open(file_txt, 'w')
        
        in_file = open(file,encoding='UTF-8')
        tree = ET.parse(in_file)
        root = tree.getroot()
        # 以下代码可忽略,你要在xml数据集上找到自己所需要数据对应的标签,想办法将其赋予一个变量,再将其写入新文件里就ok了
        for value in root.iter('xxx'):
            value = value.text
            f_w.write(value)
            f_w.write('\n\n')

还有我要说几句这个方法还是挺好用的,在你处理一个包含很多.xml文件夹的时候,能够直接读取所有xml文件,这样处理起来也比较方便。

到此这篇关于python将xml格式文件转换成txt文件的问题及解决方法(xml.etree方法)的文章就介绍到这了,更多相关python xml转换成txt文件内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯