CVS、INI、json、序列化与反序列化总结

CVS  

成都创新互联专注于容城企业网站建设,响应式网站开发,商城建设。容城网站建设公司,为容城等地区提供建站服务。全流程按需策划,专业设计,全程项目跟踪,成都创新互联专业和态度为您提供的服务

CVS 是一个被分割符,列分割符划分成行和列的文本文件。

CVS 不指定字符编码,行分割符为\r\n,最后一行可以没有换行符,列分割符常为逗号或者制表符

每一行成为一条记录record,字段可以使用双引号括起来,也可以不使用。如果字段中刚出现了双引号、逗号、换行符必须使用双引号括起来。如果字段的值是双引号,使用两个双引号表示一个转义表头可选,和字段列对齐就行了。

CSV 模块

reader(csvfile,dialect = 'excel',**fmtpararms)

返回reader对象,是一个行迭代器。

默认使用excel方言,如下:

delimiter 列分割符,逗号

lineterminator 行分分割符\r

quatechar 字段的引用符号,缺省为“双引号

双引号的处理

doublequote双引号的处理,默认为Ture.如果碰到数据中有双引号,而quotechar也是双引号,Ture则使用2个双引号表示,False表示使用转义字符将作为双引号前缀

escapechar一个转义字符,默认为None

wrirter = csv.writer(f,doublequote=False,escapechar= '@')遇到双引号,则必须提供转义字符

quoting指定双引号的规则

QUOTE_ALL所有字段

QUOTE_MONMAL特殊字符字段,Excel方言使用该规则

QUOTE_NONNIMERIC非数字字段

QUOTE_NONE 都不使用引号

writer(csvfile,dialect = 'excel',**fmtpararms)

返回DictWriter的实例

主要方法有writerow、writerows

ini文件处理

作为配置文件,ini文件格式很流行。

configparser

configpartser模块的ConfigParser类就是用来操作。

可以将section当做key,section存储的键值对组成的字典,而可以把ini配置文件当做一个嵌套的字典,默认使用的是有序字典

read(filenames,encoding= None)

读取ini文件,可以是单个文件,也可以是文件列表,可以指定文件编码。

sections()返回sections列表,缺省section不包括在内

add_section(section_name)增加一个section

has_section(section_name)判断section是否存在

option(section)返回section的所有option,会追加缺省section的option

hash_option(section,option)判断section是否存在这个option

get(section,option,*,raw=Flase,vars=None[,fallback])

从指定的段的选项上取值,如果找到返回,如果没有找到就去找DEFAULT段有没有

getint(section,option,*,raw=False,vars=None[,fallback])

getfloat(section,option,*,raw=False,vars=None[,fallback])

getboolean(section,option,*,raw=False,vars=None[,fallback])

上面3个方法和get一样,返回指定类型数据

items(raw=False,vars=None)

items(section,raw=False,vars=None)

没有section,则返回所有section名字及对象,如果指定section,则返回指定的section的键值对组成二元组

set(section,option,value)

section 存在的情况下,写入option =value,要求option,value必须是字符串

remove_section(section)

移除section下的option

wrirte(fileobject,space-around_delimiters=Ture)

将当前config所有内容写入fileobject中,一般open函数使用w模式。

Json


Json(JavaScript Object Notation,JS对象标记)是一种轻量级的数据交换格式。它基于ECMAScript的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据

Json的数据类型

双引号引起来的字符串,数值,true和false,null,对象,数组,这些都是值

字符串

由双引号包围起来的任意字符的组合,可以转义字符。

数值

有正负,有整数,浮点数

对象

无序的键值对的集合

格式{key1:value1,.......keyn,valuen}

key必须是一个字符串,需要双引号包围这个字符

value可以是任意合法的值

数组

有序的值的集合

格式:[val1,....valn]

序列化与反序列化

定义:

serialization 序列化

将内存中对象存储下来,把它变成一个个字节----->二进制

deserialization 反序列化

将文件的一个个字节恢复成内存中对象<-----二进制

序列化保持到文件就是持久化

可以将数据序列化后持久化,或者网络传输,也可以将从文件中或者网络接受到的字节序列反序列化

Python提供了pickle库

pickle库

python中的序列化、福安序列化模块

dumps 对象序列化为bytes对象

dump 对象序列化到文件对象,就是存入文件

loads 从bytes对象反序列化

load 对象反序列化,从文件读取数据

序列化应用:

一般来说,本地序列化的情况较少。大多数场景都应用在网络传输中。

将数据序列化后通过网络传输到远程节点,远程服务器上的服务将接收到的数据反序列化后,就可以使用了。但要注意一点,远程接收端,反序列化是必须有对应的数据类型,否则就会报错

,尤其是自定义类,必须远程得有一致的定义。python程序之间可以使用pickle解决序列化、反序列化,如果跨平台,跨语言,跨协议pickle就不太合适了。就需要公共的协议,例如:XML、JSON、protocol Buffer等


当前名称:CVS、INI、json、序列化与反序列化总结
标题网址:http://scyanting.com/article/gejsji.html