python怎么将xml转换为json

Python如何将XML转换为JSON：完整指南

在数据处理领域，XML（可扩展标记语言）和JSON（JavaScript对象表示法）是两种常见的数据交换格式，XML结构严谨、可扩展性强，常用于企业级应用和配置文件；JSON则轻量简洁、易于人阅读和机器解析，是Web API和前后端交互的主流格式，将XML转换为JSON的需求因此频繁出现，比如将传统XML数据适配到现代Web服务，或利用JSON的灵活性进行数据处理，本文将详细介绍如何使用Python实现XML到JSON的转换，涵盖标准库方法和第三方库方案,并提供实用示例和注意事项。

为什么需要将XML转换为JSON？

在具体实现前,先简单了解转换的必要性：

Web API兼容性：大多数现代API优先使用JSON作为数据格式，将XML数据转换为JSON能更好地与这些API集成。
数据处理效率：Python的json模块和第三方库（如pandas）对JSON的支持更完善，处理JSON数据通常更高效。
可读性优化：JSON的键值对结构比XML的层级嵌套更直观，适合快速阅读和调试。

准备工作：安装必要的库

Python标准库中已包含处理XML和JSON的模块，无需额外安装即可完成基础转换，但如果需要处理复杂XML结构（如命名空间、属性等），推荐使用第三方库xmltodict，它能简化转换逻辑。

安装`xmltodict`（可选）

pip install xmltodict

方法一：使用Python标准库（`xml.etree.ElementTree` + `json`）

Python标准库提供了xml.etree.ElementTree（简称ET）用于解析XML，json模块用于生成JSON，这种方法无需依赖第三方库，适合简单XML结构的转换，但处理复杂结构（如属性、命名空间）时需要手动编码。

示例XML数据

假设有以下XML文件data.xml：

<?xml version="1.0" encoding="UTF-8"?>
<root>
    <person id="1">
        <name>张三</name>
        <age>25</age>
        <skills>
            <skill>Python</skill>
            <skill>Java</skill>
        </skills>
        <address city="北京">
            <street>朝阳区建国路1号</street>
        </address>
    </person>
    <person id="2">
        <name>李四</name>
        <age>30</age>
        <skills>
            <skill>C++</skill>
            <skill>JavaScript</skill>
        </skills>
        <address city="上海">
            <street>浦东新区陆家嘴环路100号</street>
        </address>
    </person>
</root>

转换步骤

解析XML

使用ElementTree.parse()读取XML文件,获取根元素：

import xml.etree.ElementTree as ET
import json
# 解析XML文件
tree = ET.parse("data.xml")
root = tree.getroot()

递归转换XML元素为字典

定义一个递归函数,将XML元素及其子元素转换为字典：

def xml_to_dict(element):
    # 如果元素有文本内容且无子元素，直接返回文本
    if len(element) == 0:
        return element.text if element.text and element.text.strip() else None
    # 否则，处理子元素
    result = {}
    for child in element:
        # 递归处理子元素
        child_data = xml_to_dict(child)
        # 如果子元素名已存在，转为列表存储
        if child.tag in result:
            if not isinstance(result[child.tag], list):
                result[child.tag] = [result[child.tag]]
            result[child.tag].append(child_data)
        else:
            result[child.tag] = child_data
    # 添加元素的属性（如果有）
    if element.attrib:
        result["@attributes"] = element.attrib
    return result

生成JSON并保存

将转换后的字典通过json.dump()或json.dumps()保存为JSON文件：

# 转换整个XML为字典
xml_dict = xml_to_dict(root)
# 保存为JSON文件
with open("data_standard.json", "w", encoding="utf-8") as f:
    json.dump(xml_dict, f, ensure_ascii=False, indent=4)
print("标准库转换完成，结果已保存至data_standard.json")

输出结果

生成的data_standard.json内容如下：

{
    "person": [
        {
            "@attributes": {
                "id": "1"
            },
            "name": "张三",
            "age": "25",
            "skills": {
                "skill": [
                    "Python",
                    "Java"
                ]
            },
            "address": {
                "@attributes": {
                    "city": "北京"
                },
                "street": "朝阳区建国路1号"
            }
        },
        {
            "@attributes": {
                "id": "2"
            },
            "name": "李四",
            "age": "30",
            "skills": {
                "skill": [
                    "C++",
                    "JavaScript"
                ]
            },
            "address": {
                "@attributes": {
                    "city": "上海"
                },
                "street": "浦东新区陆家嘴环路100号"
            }
        }
    ]
}

标准库方法的优缺点

优点：无需依赖第三方库，轻量级，适合简单XML结构。
缺点：处理复杂逻辑（如重复标签、命名空间）时需要手动编码，代码量较大；属性默认统一存入@attributes,可能不符合部分场景需求。

方法二：使用第三方库`xmltodict`（推荐）

xmltodict是一个专门用于XML和JSON转换的第三方库，能自动处理XML的层级结构、属性和命名空间，代码更简洁,适合复杂XML场景。

转换步骤

解析XML并直接转换为字典

使用xmltodict.parse()方法，传入XML内容（文件或字符串）,返回字典：

import xmltodict
import json
# 读取XML文件内容
with open("data.xml", "r", encoding="utf-8") as f:
    xml_content = f.read()
# 转换XML为字典
xml_dict = xmltodict.parse(xml_content)

生成JSON并保存

与标准库方法一致，使用json.dump()保存结果：

# 保存为JSON文件
with open("data_xmltodict.json", "w", encoding="utf-8") as f:
    json.dump(xml_dict, f, ensure_ascii=False, indent=4)
print("xmltodict转换完成，结果已保存至data_xmltodict.json")

输出结果

生成的data_xmltodict.json内容与方法一基本一致，但属性处理更灵活（可通过attr_prefix参数自定义属性前缀）：

{
    "root": {
        "person": [
            {
                "@id": "1",
                "name": "张三",
                "age": "25",
                "skills": {
                    "skill": [
                        "Python",
                        "Java"
                    ]
                },
                "address": {
                    "@city": "北京",
                    "street": "朝阳区建国路1号"
                }
            },
            {
                "@id": "2",
                "name": "李四",
                "age": "30",
                "skills": {
                    "skill": [
                        "C++",
                        "JavaScript"
                    ]
                },
                "address": {
                    "@city": "上海",
                    "street": "浦东新区陆家嘴环路100号"
                }
            }
        ]
    }
}

`xmltodict`常用参数

attr_prefix：属性前缀，默认为（可设为None忽略属性，或自定义如_attr_）。
item_func：处理重复标签的函数，例如默认将重复标签转为列表。
force_list：强制指定某些标签转为列表，如force_list={"skill"}，确保<skill>始终是数组格式。

示例：自定义属性前缀

# 将属性前缀设为"_attr_"，避免与默认的"@"冲突
xml_dict = xmltodict.parse(xml_content, attr_prefix="_attr_")

输出结果中属性将变为_attr_id、_attr_city。

处理复杂XML场景的注意事项

命名空间（Namespace）

XML中的命名空间（如<ns:person>）会导致转换后的标签名包含命名空间前缀，影响JSON结构,解决方法是在解析时移除命名空间：

# 移除XML中的命名空间（适用于xmltodict）
def remove_namespace(doc):
    """去除XML文档中的命名空间"""
    for elem in doc.iter():
        # 获取标签名（

正文

python怎么将xml转换为json

Python如何将XML转换为JSON：完整指南

为什么需要将XML转换为JSON？

准备工作：安装必要的库

安装`xmltodict`（可选）

方法一：使用Python标准库（`xml.etree.ElementTree` + `json`）

示例XML数据

转换步骤

解析XML

递归转换XML元素为字典

生成JSON并保存

输出结果

标准库方法的优缺点

方法二：使用第三方库`xmltodict`（推荐）

转换步骤

解析XML并直接转换为字典

生成JSON并保存

输出结果

`xmltodict`常用参数

示例：自定义属性前缀

处理复杂XML场景的注意事项

命名空间（Namespace）

相关阅读

前端页面怎么引用json文件

什么软件可以打开json文件格式

手机文件后的json是什么

js中json数据怎么处理

发表评论取消回复

还没有评论，来说两句吧...

目录[+]

Python如何将XML转换为JSON：完整指南

为什么需要将XML转换为JSON？

准备工作：安装必要的库

安装xmltodict（可选）

方法一：使用Python标准库（xml.etree.ElementTree + json）

示例XML数据

转换步骤

解析XML

递归转换XML元素为字典

生成JSON并保存

输出结果

标准库方法的优缺点

方法二：使用第三方库xmltodict（推荐）

转换步骤

解析XML并直接转换为字典

生成JSON并保存

输出结果

xmltodict常用参数

示例：自定义属性前缀

处理复杂XML场景的注意事项

命名空间（Namespace）

相关阅读

前端页面怎么引用json文件

什么软件可以打开json文件格式

手机文件后的json是什么

js中json数据怎么处理

发表评论取消回复

还没有评论，来说两句吧...

目录[+]

安装`xmltodict`（可选）

方法一：使用Python标准库（`xml.etree.ElementTree` + `json`）

方法二：使用第三方库`xmltodict`（推荐）

`xmltodict`常用参数