解决python将xml格式文件转换成txt文件的问题(xml.etree方法)-编程学习网

概述

先来介绍一下xml格式的文件，从数据分析的角度去看xml格式的数据集，具有以下的优点开放性(能在任何平台上读取和处理数据，允许通过一些网络协议交换xml数据)、简单性(纯文本，能在不同的系统之间交换数据)、结构和内容分离(不同于HTML，数据的显示和数据本身是分开的)、可扩展性(派生出其他标记语言)

问题描述

那么我们在进行数据分析的时候，如何运用xml里面的数据呢？
我们就需要将这类文件转化成其他类型的文件。
(其实我认为说成提取xml的数据组成新的类型文件比较好一点)
就我个人的观点，处理这方面的问题有点类似于网络爬虫，但不同于爬虫的是不需要考虑IP代理地址的问题(反爬确实是一个很难处理的问题)

问题解决方案

xml格式文件显示内容大致如下：

在这里插入图片描述


import os
import sys
import xml.etree.ElementTree as ET
import glob

def xml_to_txt(indir, outdir):
    os.chdir(indir) # indir为xml文件来源的文件夹，outdir为转换的txt文件存储路径
    annotated = os.listdir('.') # 返回包含目录中文件名称的列表
    print(annotated)
    
    for i, file in enumerate(annotated):
        file_save = file.split('.')[0] + '.txt' #split将文件名与后缀名划分开来
        file_txt = outdir + "\\"+file_save
        f_w = open(file_txt, 'w')
        
        in_file = open(file,encoding='UTF-8')
        tree = ET.parse(in_file)
        root = tree.getroot()
        # 以下代码可忽略，你要在xml数据集上找到自己所需要数据对应的标签，想办法将其赋予一个变量，再将其写入新文件里就ok了
        for value in root.iter('xxx'):
            value = value.text
            f_w.write(value)
            f_w.write('\n\n')

还有我要说几句这个方法还是挺好用的，在你处理一个包含很多.xml文件夹的时候，能够直接读取所有xml文件，这样处理起来也比较方便。

到此这篇关于python将xml格式文件转换成txt文件的问题及解决方法(xml.etree方法)的文章就介绍到这了,更多相关python xml转换成txt文件内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

文章详情

解决python将xml格式文件转换成txt文件的问题(xml.etree方法)

概述

问题描述

问题解决方案

软考中级精品资料免费领

相关文章

猜你喜欢

解决python将xml格式文件转换成txt文件的问题(xml.etree方法)

Python实现将HTML转换成doc格式文件的方法示例

Python的文本文件转换编码问题怎么解决

pycharm创建py文件总是为txt格式的问题及解决

PHP写入txt文件时出现乱码问题的解决方法

python logging 日志轮转文件不删除问题的解决方法

springboot中生成文件路径的问题及解决方法

Python中文件操作的常见问题及解决方法

文件操作：Python 中的常见问题及解决方法

使用pyinstaller打包python文件遇到的问题和解决方法

springboot中生成文件路径的问题及解决方法是什么

vue2文件流下载成功后文件格式错误、打不开及内容缺失的解决方法

python中关于py文件之间相互import的问题及解决方法

pycharm中:OSError:[WinError 1455]页面文件太小无法完成操作问题的多种解决方法

【IDEA优化】：解决MyBatis Mapper 的XML文件SQL语句无法自动提示问题（独家方案，亲测可用）

python在win10上打包exe文件在win7上不兼容，显示api-ms-win-core-path的dll文件找不到的问题的解决方法

漏刻有时数据可视化大屏常见问题(9)：mysql数据库.sql文件制作自动安装格式的解决方案