python基础教程:序列化

栏目: Python · 发布时间: 6年前

内容简介:上一节我们学习了文件的读写,把一个字符串(或字节对象)保存到磁盘是一件很容易的事情。但是在实际编程中,我们经常需要保存结构化数据,比如复杂的字典、嵌套的列表等等,这时候就需要我们想办法把这些结构化数据先转变成一个字符串,这个转换过程就叫做“序列化”,这一过程的逆操作就是“反序列化”。序列化数据的操作在各个语言编程中都会遇到,当然也出现了标准化的格式,比如:JSON(JavaScript Object Notation)。JSON格式通常被现代应用程序用于数据交换,尤其是在Web中广为人知,是许多程序员的选择

上一节我们学习了文件的读写,把一个字符串(或字节对象)保存到磁盘是一件很容易的事情。但是在实际编程中,我们经常需要保存结构化数据,比如复杂的字典、嵌套的列表等等,这时候就需要我们想办法把这些结构化数据先转变成一个字符串,这个转换过程就叫做“序列化”,这一过程的逆操作就是“反序列化”。

python基础教程:序列化

JSON序列化

序列化数据的操作在各个语言编程中都会遇到,当然也出现了标准化的格式,比如:JSON(JavaScript Object Notation)。JSON格式通常被现代应用程序用于数据交换,尤其是在Web中广为人知,是许多 程序员 的选择。Python支持JSON的模块叫做 json

JSON的数据格式和 Python 中的字典和列表非常相似,可以说它是字典和列表相互嵌套的结合体,而这些字典和列表的基本数据类型只能是:字符串、整数、浮点数、布尔型、None,不能是自定义的类等复杂对象。

一个对象 x 可以用一行简单的代码转换成它对应的JSON字符串:

In [124]: import json

In [125]: json.dumps({'Tom': 23, 'Jim': 25, 'William': 21})
Out[125]: '{"Tom": 23, "Jim": 25, "William": 21}'

把JSON字符串反序列化为Python对象的代码也只有一行:

In [126]: json.loads('{"Tom": 23, "Jim": 25, "William": 21}')
Out[126]: {'Tom': 23, 'Jim': 25, 'William': 21}

dumps() 方法有个变体叫做 dump() ,它是将对象序列化到文件中。如果 f 是一个文件对象,我们可以这样操作:

json.dump(x, f)

对应的,从文件对象 f 中反序列化的操作就是:

x = json.load(f)

dumps() 函数有很多参数可选,使我们生成不同格式的JSON字符串,具体可以在IPython中通过 json.dumps? 来查看。我们可以通过下面的例子来了解一下:

(1)紧凑编码

通过 separators 参数来实现:

In [130]: json.dumps({"Tom": 23, "Jim": 25, "William": 21}, separators=(',', ':'))
Out[130]: '{"Tom":23,"Jim":25,"William":21}'

(2)美化输出

通过 sort_keys, indent 参数来实现:

In [132]: print(json.dumps({"Tom": 23, "Jim": 25, '9':3, '3': 10}, sort_keys=True, indent=4))
{
    "3": 10,
    "9": 3,
    "Jim": 25,
    "Tom": 23
}

(3)中文编码

参数 ensure_ascii 默认为True,会把中文等非ascii字符转义:

In [133]: print(json.dumps({"小刚": 23, "小明": 25, '9':3, '3': 10}, sort_keys=True, indent=4))
{
    "3": 10,
    "9": 3,
    "\u5c0f\u521a": 23,
    "\u5c0f\u660e": 25
}

In [134]: print(json.dumps({"小刚": 23, "小明": 25, '9':3, '3': 10}, sort_keys=True, indent=4, ensure_ascii=False))
{
    "3": 10,
    "9": 3,
    "小刚": 23,
    "小明": 25
}

pickle模块序列化

json 模块不同, pickle 可以对任意复杂的Python对象进行序列化,它是Python特有的,不能与其它语言进行通信。默认情况下,它也是不安全的,如果数据是由黑客精心设计的,则反序列化的数据可能被植入恶意代码。

pickle 的接口跟 json 是一样的,序列化用 dumps(x), dump(x, f) ,反序列化使用 loads(s), load(f) 。但是, pickle 可以序列化任意复杂的对象,比如自定义的类、函数都是可以用它来序列化的。比如下面这个例子就是序列化b并反序列化一个函数:

In [136]: def add(x, y): 
     ...:     print(x+y) 
     ...:

In [137]: import pickle

In [138]: s = pickle.dumps(add)

In [139]: s
Out[139]: b'\x80\x03c__main__\nadd\nq\x00.'

In [140]: f = pickle.loads(s)

In [141]: f
Out[141]: <function __main__.add(x, y)>

In [142]: f(2, 3)
5

从这个例子中,我们实现了序列化和反序列化一个函数的功能。这样,我们可以把一些函数、自定义的类等各种对象先序列化到文件,然后把这个文件发给别人,别人可以通过反序列化来使用这些自定义的类和函数。这个过程中,如果有人对序列化文件做了手脚,比如通过修改文件修改了函数 add() 的实现,就有可能被黑客利用来进行攻击。这也是前面我们为什么说 pickle 默认是不安全的。所以,在选择是否使用它进行序列化时,要先思考一番。

总结

Python为我们提供了数据序列化的工具。如果需要和其它程序进行数据交换,json是最好的选择。如果是自己内部使用,pickle可以作为一个选择进行复杂对象的序列化。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Web Analytics 2.0

Web Analytics 2.0

Avinash Kaushik / Sybex / 2009-10-26 / USD 39.99

The bestselling book Web Analytics: An Hour A Day was the first book in the analytics space to move beyond clickstream analysis. Web Analytics 2.0 will significantly evolve the approaches from the fir......一起来看看 《Web Analytics 2.0》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试