如何在json显示中文乱码

JSON显示中文乱码的常见原因与解决方案

在开发过程中,JSON（JavaScript Object Notation）作为轻量级的数据交换格式，被广泛应用于前后端数据传输、配置文件存储等场景，许多开发者都遇到过JSON中显示中文乱码的问题——原本正常的中文内容在解析或展示时变成了“\u4e2d\u6587”这样的Unicode编码，或是直接显示为“???”等乱码符号，本文将分析JSON中文乱码的常见原因，并提供针对性的解决方案。

JSON中文乱码的常见原因

数据编码与传输编码不一致

JSON数据本身是通过文本形式存储和传输的,其编码方式（如UTF-8、GBK、ISO-8859-1等）是乱码的核心诱因，常见场景包括：

源数据编码与JSON序列化编码不一致：后端数据源使用GBK编码（如MySQL数据库的字符集为GBK），但序列化为JSON时未正确处理编码，导致JSON字符串中的中文被错误解析。
HTTP响应头未声明编码：后端通过HTTP接口返回JSON数据时，若未在Content-Type头中明确指定字符编码（如Content-Type: application/json; charset=utf-8），浏览器或客户端可能默认使用ISO-8859-1等编码解析，从而出现乱码。

JSON字符串未正确转义

JSON规范要求字符串中的特殊字符（如双引号、反斜杠、换行符等）必须进行转义处理，但中文本身无需转义，部分开发者在手动构造JSON字符串时，可能会误将中文也进行Unicode转义（如"name": "\u4e2d\u56fd"），导致解析时显示为转义后的编码而非原始中文，这种情况虽非“乱码”，但不符合人类可读的直观需求。

客户端解析时编码处理错误

客户端（如浏览器、JavaScript代码、Postman等）在解析JSON数据时，若未遵循服务端声明的编码方式，也可能导致乱码。

JavaScript直接解析未声明编码的响应：通过fetch或XMLHttpRequest获取JSON数据时，若服务端未返回charset参数，JavaScript可能默认使用UTF-8解析（通常能兼容），但若服务端实际使用GBK编码，仍会出现乱码。
开发工具默认编码问题：使用Postman等工具测试接口时，若工具默认编码与响应编码不一致，可能导致中文显示异常。

JSON中文乱码的解决方案

确保数据编码与传输编码统一（核心方案）

（1）后端序列化时指定UTF-8编码

无论后端使用何种编程语言（Java、Python、PHP、Node.js等），在将数据序列化为JSON字符串时，务必确保使用UTF-8编码，以下是常见语言的示例：

Java（使用Jackson/Gson）：

// 使用Jackson
ObjectMapper objectMapper = new ObjectMapper();
objectMapper.setPropertyNamingStrategy(PropertyNamingStrategies.SNAKE_CASE);
String jsonStr = objectMapper.writeValueAsString(data); // 默认UTF-8
// 使用Gson
Gson gson = new GsonBuilder().setPrettyPrinting().create();
String jsonStr = gson.toJson(data); // 默认UTF-8

Python（使用json模块）：
```
import json
data = {"name": "中文", "age": 18}
json_str = json.dumps(data, ensure_ascii=False)  # 关闭ASCII转义，直接输出中文
print(json_str)  # 输出: {"name": "中文", "age": 18}
```
注意：Python的json.dumps()默认会使用ensure_ascii=True，将非ASCII字符转为Unicode编码（如\u4e2d\u6587），因此必须显式设置ensure_ascii=False。

Node.js（使用JSON.stringify）：

const data = { name: "中文", age: 18 };
const jsonStr = JSON.stringify(data, null, 2); // 默认直接输出中文（无需额外处理）
console.log(jsonStr); // 输出: { "name": "中文", "age": 18 }

（2）HTTP响应头明确声明字符编码

后端在返回JSON数据时,需在HTTP响应头中设置Content-Type为application/json，并附带charset=utf-8参数。

Java（Spring Boot）：

@GetMapping("/api/data")
@ResponseBody
public String getData() {
    return "{\"name\": \"中文\"}";
}
// 或通过注解指定（Spring Boot默认会处理，但显式声明更稳妥）
@GetMapping(value = "/api/data", produces = "application/json;charset=utf-8")
@ResponseBody
public String getData() {
    return "{\"name\": \"中文\"}";
}

Node.js（Express）：

app.get('/api/data', (req, res) => {
    res.setHeader('Content-Type', 'application/json; charset=utf-8');
    res.json({ name: "中文" });
});

避免不必要的Unicode转义

若JSON字符串中的中文被错误转为Unicode编码（如\u4e2d\u6587），需检查序列化过程是否误启了“强制ASCII转义”选项。

Python：确保json.dumps()的ensure_ascii=False。
Java（Jackson）：默认情况下不会转义中文，若使用了ObjectMapper.enable(SerializationFeature.INDENT_OUTPUT)等配置，也不会影响中文显示。
手动构造JSON：避免手动将中文转为Unicode，直接使用原始字符串即可。

客户端正确解析编码

（1）浏览器端（JavaScript）

通过fetch或XMLHttpRequest获取JSON数据时，若服务端已正确声明charset=utf-8，浏览器会自动按UTF-8解析，若服务端未声明，可通过以下方式处理：

// fetch示例（自动处理UTF-8）
fetch('/api/data')
    .then(response => response.json()) // response.json()会按Content-Type的charset解析
    .then(data => console.log(data.name)); // 输出: 中文
// XMLHttpRequest示例
const xhr = new XMLHttpRequest();
xhr.open('GET', '/api/data');
xhr.setRequestHeader('Content-Type', 'application/json; charset=utf-8'); // 显式声明（可选）
xhr.onload = function() {
    if (xhr.status === 200) {
        const data = JSON.parse(xhr.responseText);
        console.log(data.name); // 输出: 中文
    }
};
xhr.send();

（2）Postman等工具

若在Postman中看到JSON中文乱码,可尝试以下操作：

检查响应头中的Content-Type是否包含charset=utf-8。
在Postman的“Settings”中，将“Render”选项设置为“Preview”，确保以文本形式展示JSON。
若服务端实际使用GBK编码,需在Postman中手动指定编码（部分高级工具支持）。

数据源编码一致性处理

若JSON数据来自数据库或其他数据源,需确保数据源的编码与JSON序列化编码一致。

MySQL数据库：创建数据库时指定字符集为utf8mb4（兼容Emoji和中文），连接URL中添加useUnicode=true&characterEncoding=UTF-8。
```
// JDBC连接示例
String url = "jdbc:mysql://localhost:3306/db_name?useUnicode=true&characterEncoding=UTF-8";
```
文件读取：若从文件中读取JSON数据，需以UTF-8编码打开文件，例如Python中：
```
with open('data.json', 'r', encoding='utf-8') as f:
    data = json.load(f)
```

JSON中文乱码排查步骤

遇到JSON中文乱码时,可按以下步骤系统排查：

检查服务端响应头：确认Content-Type是否包含charset=utf-8。
检查JSON序列化逻辑：确保后端序列化时使用UTF-8编码，且未错误转义中文（如Python的ensure_ascii=False）。
检查数据源编码：确认数据库、文件等数据源的编码与JSON编码一致。
检查客户端解析：确保客户端（浏览器、工具）按UTF-8解析响应，未使用默认编码（如ISO-8859-1）。

JSON中文乱码的本质是“编码不一致”，只要确保从数据源、序列化、传输到解析的全链路编码统一为UTF-8，即可有效避免乱码问题，遵循JSON规范、显式声明编码、避免不必要的转义，是处理乱码的核心原则。

正文

如何在json显示中文乱码

JSON显示中文乱码的常见原因与解决方案

JSON中文乱码的常见原因

数据编码与传输编码不一致

JSON字符串未正确转义

客户端解析时编码处理错误

JSON中文乱码的解决方案

确保数据编码与传输编码统一（核心方案）

（1）后端序列化时指定UTF-8编码

（2）HTTP响应头明确声明字符编码

避免不必要的Unicode转义

客户端正确解析编码

（1）浏览器端（JavaScript）

（2）Postman等工具

数据源编码一致性处理

JSON中文乱码排查步骤

相关阅读

前端页面怎么引用json文件

什么软件可以打开json文件格式

手机文件后的json是什么

js中json数据怎么处理

发表评论取消回复

还没有评论，来说两句吧...

目录[+]