如何将数据写入json文件格式

如何将数据写入JSON文件格式：从基础到实践的完整指南

引言：为什么需要将数据写入JSON文件？

在数据驱动的时代，数据的持久化存储是开发中不可或缺的一环，JSON（JavaScript Object Notation）作为一种轻量级、易读易写的数据交换格式，因其结构简单（基于键值对）、与语言无关（几乎所有编程语言都支持解析）以及兼容性好（可直接映射为对象/字典）等特点，成为开发者存储和传输数据的首选格式之一。

无论是保存用户配置、缓存接口响应，还是存储结构化业务数据，将数据写入JSON文件都是一项基础且高频的操作，本文将以Python为例（因其语法简洁、JSON库原生支持），从基础操作到进阶技巧，详细讲解如何将数据写入JSON文件,并附常见问题解决方案。

准备工作：理解JSON数据结构

在写入数据前，需先明确JSON的核心数据结构，这有助于我们组织待存储的数据，JSON支持以下两种结构：

对象（Object）：无序的键值对集合，用包裹，键必须是字符串（需用双引号包裹），值可以是字符串、数字、布尔值、数组、对象甚至null。
```
{"name": "张三", "age": 25, "isStudent": false}
```
数组（Array）：有序的值列表，用 [] 包裹，值可以是任意JSON支持的类型。
```
[1, "apple", {"key": "value"}, true]
```

实际应用中，我们通常将Python的字典（dict）映射为JSON对象，列表（list）映射为JSON数组,待写入的数据需先组织为字典或列表形式。

核心步骤：用Python将数据写入JSON文件

Python内置了json模块，无需安装即可直接使用，提供了dump()和dumps()两个核心方法：

json.dump()：将Python对象直接写入文件流（适用于写入文件）。
json.dumps()：将Python对象转换为JSON格式字符串（适用于字符串处理，如打印或网络传输）。

本文重点介绍json.dump()的使用，步骤如下：

准备待写入的Python数据

假设我们要存储一个用户信息，数据结构如下：

user_data = {
    "name": "李四",
    "age": 30,
    "hobbies": ["阅读", "游泳", "编程"],
    "contact": {
        "email": "lisi@example.com",
        "phone": "13800138000"
    },
    "isActive": True
}

这是一个典型的嵌套结构（字典包含列表和字典）,可直接转换为JSON对象。

打开文件并写入数据

使用json.dump()时，需通过open()函数以写入模式（'w'）打开文件（注意：JSON文件通常用.json作为后缀），代码如下：

import json
# 待写入的Python数据
user_data = {
    "name": "李四",
    "age": 30,
    "hobbies": ["阅读", "游泳", "编程"],
    "contact": {
        "email": "lisi@example.com",
        "phone": "13800138000"
    },
    "isActive": True
}
# 打开文件（使用utf-8编码避免中文乱码）
with open("user_data.json", "w", encoding="utf-8") as f:
    json.dump(user_data, f, ensure_ascii=False, indent=4)

关键参数说明：

ensure_ascii=False：默认情况下，json.dump()会将非ASCII字符（如中文）转义为\u编码，设置False可保留原字符（如“李四”而非\u674e\u56db）。
indent=4：指定缩进空格数，使JSON文件格式化（美观易读）；若省略，JSON会以紧凑格式存储（无换行和缩进）。

验证文件内容

执行上述代码后，会在当前目录下生成user_data.json如下：

{
    "name": "李四",
    "age": 30,
    "hobbies": [
        "阅读",
        "游泳",
        "编程"
    ],
    "contact": {
        "email": "lisi@example.com",
        "phone": "13800138000"
    },
    "isActive": true
}

可见，Python的dict和list被正确转换为JSON对象和数组，布尔值True转为true（JSON规范要求小写）。

进阶技巧：处理复杂数据与场景需求

处理自定义对象（如类实例）

若待写入的是自定义类的实例，直接json.dump()会报错（TypeError：Object of type XXX is not JSON serializable），此时需通过default参数指定序列化方法，例如将对象属性转为字典：

import json
class User:
    def __init__(self, name, age):
        self.name = name
        self.age = age
user = User("王五", 28)
# 自定义序列化函数
def user_to_dict(obj):
    return {"name": obj.name, "age": obj.age}
with open("user_object.json", "w", encoding="utf-8") as f:
    json.dump(user, f, default=user_to_dict, ensure_ascii=False, indent=4)

输出文件：

{
    "name": "王五",
    "age": 28
}

追加数据到JSON文件（而非覆盖）

若需向现有JSON文件追加数据（如日志记录），需先读取原文件内容，修改后再写回，例如向user_data.json的hobbies列表添加新爱好：

import json
# 读取原文件
with open("user_data.json", "r", encoding="utf-8") as f:
    data = json.load(f)
# 修改数据
data["hobbies"].append("摄影")
# 写回文件
with open("user_data.json", "w", encoding="utf-8") as f:
    json.dump(data, f, ensure_ascii=False, indent=4)

此时user_data.json的hobbies会更新为["阅读", "游泳", "编程", "摄影"]。

处理大数据流（避免内存溢出）

若数据量极大（如百万级记录），直接加载到内存可能导致MemoryError，此时可逐条写入JSON文件，构建“JSON Lines”（每行一个JSON对象）格式：

import json
# 模拟大数据流（如数据库查询结果）
data_stream = [
    {"id": 1, "value": "A"},
    {"id": 2, "value": "B"},
    {"id": 3, "value": "C"}
]
with open("large_data.jsonl", "w", encoding="utf-8") as f:
    for item in data_stream:
        # 逐条写入，每行一个JSON对象
        json.dump(item, f, ensure_ascii=False)
        f.write("\n")  # 换行分隔

输出文件large_data.jsonl内容：

{"id": 1, "value": "A"}
{"id": 2, "value": "B"}
{"id": 3, "value": "C"}

常见问题与解决方案

中文乱码问题

现象：写入JSON文件后，中文显示为\u编码（如"name": "\u674e\u56db"）。
原因：json.dump()默认使用ASCII编码转义非ASCII字符。
解决：设置ensure_ascii=False，并在open()时指定encoding="utf-8"（如前文核心步骤所示）。

文件权限问题

现象：运行时报错PermissionError: [Errno 13] Permission denied。
原因：文件被其他程序占用，或用户对目标目录无写入权限。
解决：关闭占用文件的程序，或检查文件路径权限（如使用chmod修改权限）。

数据类型不兼容

现象：写入包含datetime、set等Python特有类型的数据时报错。
原因：JSON不支持datetime、set等类型。
解决：自定义序列化函数（如将datetime转为字符串）：

from datetime import datetime
import json
data = {"time": datetime.now()}
def datetime_to_str(obj):
    if isinstance(obj, datetime):
        return obj.strftime("%Y-%m-%d %H:%M:%S")
with open("datetime_data.json", "w", encoding="utf-8")

正文

如何将数据写入json文件格式