python基础教程:序列化

栏目: Python · 发布时间: 5年前

内容简介:上一节我们学习了文件的读写,把一个字符串(或字节对象)保存到磁盘是一件很容易的事情。但是在实际编程中,我们经常需要保存结构化数据,比如复杂的字典、嵌套的列表等等,这时候就需要我们想办法把这些结构化数据先转变成一个字符串,这个转换过程就叫做“序列化”,这一过程的逆操作就是“反序列化”。序列化数据的操作在各个语言编程中都会遇到,当然也出现了标准化的格式,比如:JSON(JavaScript Object Notation)。JSON格式通常被现代应用程序用于数据交换,尤其是在Web中广为人知,是许多程序员的选择

上一节我们学习了文件的读写,把一个字符串(或字节对象)保存到磁盘是一件很容易的事情。但是在实际编程中,我们经常需要保存结构化数据,比如复杂的字典、嵌套的列表等等,这时候就需要我们想办法把这些结构化数据先转变成一个字符串,这个转换过程就叫做“序列化”,这一过程的逆操作就是“反序列化”。

python基础教程:序列化

JSON序列化

序列化数据的操作在各个语言编程中都会遇到,当然也出现了标准化的格式,比如:JSON(JavaScript Object Notation)。JSON格式通常被现代应用程序用于数据交换,尤其是在Web中广为人知,是许多 程序员 的选择。Python支持JSON的模块叫做 json

JSON的数据格式和 Python 中的字典和列表非常相似,可以说它是字典和列表相互嵌套的结合体,而这些字典和列表的基本数据类型只能是:字符串、整数、浮点数、布尔型、None,不能是自定义的类等复杂对象。

一个对象 x 可以用一行简单的代码转换成它对应的JSON字符串:

In [124]: import json

In [125]: json.dumps({'Tom': 23, 'Jim': 25, 'William': 21})
Out[125]: '{"Tom": 23, "Jim": 25, "William": 21}'

把JSON字符串反序列化为Python对象的代码也只有一行:

In [126]: json.loads('{"Tom": 23, "Jim": 25, "William": 21}')
Out[126]: {'Tom': 23, 'Jim': 25, 'William': 21}

dumps() 方法有个变体叫做 dump() ,它是将对象序列化到文件中。如果 f 是一个文件对象,我们可以这样操作:

json.dump(x, f)

对应的,从文件对象 f 中反序列化的操作就是:

x = json.load(f)

dumps() 函数有很多参数可选,使我们生成不同格式的JSON字符串,具体可以在IPython中通过 json.dumps? 来查看。我们可以通过下面的例子来了解一下:

(1)紧凑编码

通过 separators 参数来实现:

In [130]: json.dumps({"Tom": 23, "Jim": 25, "William": 21}, separators=(',', ':'))
Out[130]: '{"Tom":23,"Jim":25,"William":21}'

(2)美化输出

通过 sort_keys, indent 参数来实现:

In [132]: print(json.dumps({"Tom": 23, "Jim": 25, '9':3, '3': 10}, sort_keys=True, indent=4))
{
    "3": 10,
    "9": 3,
    "Jim": 25,
    "Tom": 23
}

(3)中文编码

参数 ensure_ascii 默认为True,会把中文等非ascii字符转义:

In [133]: print(json.dumps({"小刚": 23, "小明": 25, '9':3, '3': 10}, sort_keys=True, indent=4))
{
    "3": 10,
    "9": 3,
    "\u5c0f\u521a": 23,
    "\u5c0f\u660e": 25
}

In [134]: print(json.dumps({"小刚": 23, "小明": 25, '9':3, '3': 10}, sort_keys=True, indent=4, ensure_ascii=False))
{
    "3": 10,
    "9": 3,
    "小刚": 23,
    "小明": 25
}

pickle模块序列化

json 模块不同, pickle 可以对任意复杂的Python对象进行序列化,它是Python特有的,不能与其它语言进行通信。默认情况下,它也是不安全的,如果数据是由黑客精心设计的,则反序列化的数据可能被植入恶意代码。

pickle 的接口跟 json 是一样的,序列化用 dumps(x), dump(x, f) ,反序列化使用 loads(s), load(f) 。但是, pickle 可以序列化任意复杂的对象,比如自定义的类、函数都是可以用它来序列化的。比如下面这个例子就是序列化b并反序列化一个函数:

In [136]: def add(x, y): 
     ...:     print(x+y) 
     ...:

In [137]: import pickle

In [138]: s = pickle.dumps(add)

In [139]: s
Out[139]: b'\x80\x03c__main__\nadd\nq\x00.'

In [140]: f = pickle.loads(s)

In [141]: f
Out[141]: <function __main__.add(x, y)>

In [142]: f(2, 3)
5

从这个例子中,我们实现了序列化和反序列化一个函数的功能。这样,我们可以把一些函数、自定义的类等各种对象先序列化到文件,然后把这个文件发给别人,别人可以通过反序列化来使用这些自定义的类和函数。这个过程中,如果有人对序列化文件做了手脚,比如通过修改文件修改了函数 add() 的实现,就有可能被黑客利用来进行攻击。这也是前面我们为什么说 pickle 默认是不安全的。所以,在选择是否使用它进行序列化时,要先思考一番。

总结

Python为我们提供了数据序列化的工具。如果需要和其它程序进行数据交换,json是最好的选择。如果是自己内部使用,pickle可以作为一个选择进行复杂对象的序列化。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

21天学通C语言

21天学通C语言

(美国)琼斯(Bradley L.Jones) (美国)埃特肯(Peter Aitken) / 信达工作室 / 人民邮电出版社 / 2012-8 / 69.00元

《21天学通C语言(第6版•修订版)》是初学者学习C语言的经典教程。本版按最新的标准(ISO∕IEC:9899-1999),以循序渐进的方式介绍了C语言编程方面知识,并提供了丰富的实例和大量的练习。通过学习实例,并将所学的知识用于完成练习,读者将逐步了解、熟悉并精通C语言。《21天学通C语言(第6版•修订版)》包括四周的课程。第一周的课程介绍了C语言程序的基本元素,包括变量、常量、语句、表达式、函......一起来看看 《21天学通C语言》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

html转js在线工具
html转js在线工具

html转js在线工具