python如何存储json

Python中JSON数据的存储：从基础到实践**

JSON（JavaScript Object Notation）作为一种轻量级的数据交换格式，因其易于人阅读和编写，同时也易于机器解析和生成，在当今的软件开发中得到了广泛应用，Python作为一门功能强大的编程语言，提供了内置的模块来轻松处理JSON数据，本文将详细介绍如何在Python中存储JSON数据，涵盖从基本概念到实际操作的各个方面。

为什么选择JSON存储数据？

在讨论如何存储之前,我们先简单了解一下为什么JSON是存储数据的常用选择：

简单易读：JSON的语法简洁明了，基于键值对，结构清晰，易于人类理解和调试。
语言无关：几乎所有现代编程语言都支持JSON的解析和生成，使得跨语言数据交换变得非常方便。
数据结构灵活：JSON可以表示复杂的数据结构，如嵌套的对象（字典）和数组（列表）。
广泛支持：许多Web API、配置文件和数据存储系统都直接支持JSON格式。

Python中处理JSON的核心模块：`json`

Python内置了json模块，它提供了四个主要的函数来处理JSON数据：

json.dump()：将Python对象序列化为JSON格式，并写入到文件对象中（直接存储到文件）。
json.dumps()：将Python对象序列化为JSON格式的字符串。
json.load()：从文件对象中读取JSON数据，并反序列化为Python对象。
json.loads()：从JSON格式字符串中读取数据，并反序列化为Python对象。

本文重点介绍与“存储”相关的json.dump()和json.dumps()。

使用`json.dump()`将数据直接存储到文件

这是最常用的JSON存储方式,因为它直接将数据持久化到磁盘文件中。

基本语法

json.dump(obj, fp, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

obj：要序列化的Python对象（如字典、列表、字符串、数字、布尔值、None）。
fp：一个已打开的文件对象，必须以写入模式（'w'）或追加模式（'a'）打开，并且通常是文本模式（'wt'，虽然JSON标准是文本，但二进制模式'wb'配合ensure_ascii=False有时也能工作，推荐使用文本模式）。
indent：可选参数，用于指定缩进字符串，使输出的JSON文件更具可读性，通常是一个非负整数，表示缩进的空格数。
ensure_ascii：默认为True，确保输出的所有字符都是ASCII字符，非ASCII字符会被转义，如果设置为False，则允许输出非ASCII字符（如中文），这在处理多语言文本时非常有用。
sort_keys：默认为False，如果设置为True，则输出JSON对象的键会按字母顺序排序。

示例

假设我们有一个Python字典,想要将其存储到一个名为data.json的文件中。

import json
# 1. 准备Python数据（通常是字典或列表）
user_data = {
    "name": "张三",
    "age": 30,
    "is_student": False,
    "courses": ["Python", "JavaScript", "Database"],
    "address": {
        "street": "科技路1号",
        "city": "北京"
    }
}
# 2. 打开文件（使用with语句确保文件正确关闭）
# 使用'w'模式，如果文件已则覆盖，不存在则创建
with open('data.json', 'w', encoding='utf-8') as f:
    # 3. 使用json.dump()将数据写入文件
    # indent=4 使JSON文件格式化，更易读
    # ensure_ascii=False 确保中文等非ASCII字符正常显示
    json.dump(user_data, f, indent=4, ensure_ascii=False)
print("数据已成功存储到 data.json 文件中。")

执行上述代码后,data.json如下：

{
    "name": "张三",
    "age": 30,
    "is_student": false,
    "courses": [
        "Python",
        "JavaScript",
        "Database"
    ],
    "address": {
        "street": "科技路1号",
        "city": "北京"
    }
}

使用`json.dumps()`将数据转换为JSON字符串

我们可能不需要立即将数据写入文件,而是需要先将其转换为JSON字符串，以便在程序中传递、显示或进行其他处理。

基本语法

json.dumps(obj, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

参数与json.dump()类似，但没有文件对象fp参数。

示例

import json
# 准备Python数据
product_info = {
    "id": "P001",
    "name": "无线鼠标",
    "price": 99.99,
    "in_stock": True
}
# 使用json.dumps()将数据转换为JSON字符串
json_string = json.dumps(product_info, indent=2, ensure_ascii=False)
print("转换后的JSON字符串：")
print(json_string)
# 可以将这个字符串写入文件，或者通过网络发送
with open('product.json', 'w', encoding='utf-8') as f:
    f.write(json_string)
print("\nJSON字符串也已写入 product.json 文件。")

处理复杂数据类型（自定义序列化）

标准的json模块只能处理Python的基本数据类型（dict, list, str, int, float, bool, None），如果我们的Python对象中包含了自定义类的实例，直接使用json.dump()或json.dumps()会抛出TypeError。

为了处理这种情况,我们可以使用default参数，它应该是一个函数，当遇到不可序列化的对象时，调用这个函数来返回一个可序列化的对象。

示例：序列化自定义类对象

import json
from datetime import datetime
class User:
    def __init__(self, name, birth_date):
        self.name = name
        self.birth_date = birth_date  # datetime对象
    def __repr__(self):
        return f"User(name='{self.name}', birth_date='{self.birth_date}')"
# 创建自定义对象
user = User("李四", datetime(1990, 5, 15))
# 自定义序列化函数
def custom_serializer(obj):
    if isinstance(obj, User):
        return {
            "name": obj.name,
            "birth_date": obj.birth_date.isoformat()  # 将datetime对象转换为ISO格式字符串
        }
    elif isinstance(obj, datetime):
        return obj.isoformat()
    raise TypeError(f"Object of type {type(obj)} is not JSON serializable")
try:
    # 直接序列化会失败
    # json.dumps(user)
    pass
except TypeError as e:
    print(f"直接序列化失败: {e}")
# 使用default参数进行自定义序列化
json_string = json.dumps(user, default=custom_serializer, indent=2, ensure_ascii=False)
print("使用自定义序列化器后的JSON字符串：")
print(json_string)
# 也可以将多个对象放入列表或字典中再序列化
users = [
    User("王五", datetime(1985, 8, 20)),
    User("赵六", datetime(1992, 11, 5))
]
json_users = json.dumps(users, default=custom_serializer, indent=2, ensure_ascii=False)
print("\n用户列表的JSON字符串：")
print(json_users)

存储JSON时的注意事项

文件编码：始终推荐使用encoding='utf-8'打开文件，以确保JSON文件能正确处理各种字符（尤其是中文）。
文件模式：使用'w'模式会覆盖已存在的文件，如果需要追加内容，可以使用'a'模式，但要注意JSON格式通常是一个完整的结构，追加可能会导致文件格式无效。
数据类型限制：确保要存储的数据是JSON支持的数据类型，或已通过自定义序列化器处理。
安全性：如果JSON数据来源于不可信的外部输入，使用json.loads()或json.load()时要注意潜在的安全风险（尽管Python的json模块相对安全，但其他语言的JSON解析器可能存在漏洞），避免使用eval()等危险函数来解析JSON。
大文件处理：对于非常大的JSON数据，直接使用json.dump()一次性写入文件是可行的，但如果内存受限，可以考虑逐条写入（如果是列表，可以逐个元素序列化并写入，但要注意保持JSON结构的完整性，这可能需要手动构造JSON文本）。

在Python

正文

python如何存储json

为什么选择JSON存储数据？

Python中处理JSON的核心模块：`json`

使用`json.dump()`将数据直接存储到文件

基本语法

示例

使用`json.dumps()`将数据转换为JSON字符串

基本语法

示例

处理复杂数据类型（自定义序列化）

示例：序列化自定义类对象

存储JSON时的注意事项

相关阅读

前端页面怎么引用json文件

什么软件可以打开json文件格式

手机文件后的json是什么

js中json数据怎么处理

发表评论取消回复

还没有评论，来说两句吧...

目录[+]

为什么选择JSON存储数据？

Python中处理JSON的核心模块：json

使用json.dump()将数据直接存储到文件

基本语法

示例

使用json.dumps()将数据转换为JSON字符串

基本语法

示例

处理复杂数据类型（自定义序列化）

示例：序列化自定义类对象

存储JSON时的注意事项

相关阅读

前端页面怎么引用json文件

什么软件可以打开json文件格式

手机文件后的json是什么

js中json数据怎么处理

发表评论取消回复

还没有评论，来说两句吧...

目录[+]

Python中处理JSON的核心模块：`json`

使用`json.dump()`将数据直接存储到文件

使用`json.dumps()`将数据转换为JSON字符串