在python不同版本中,使用了不同的编码字符集
- python2 使用了 ASCII 字符集
- python3 使用了 UTF-8 字符集
ASCII,仅有266个字符,一个ASCII字符在内存中占1个字节
UTF-8是通用字符集,包含了中文在内的几乎所有语言,大多数汉字使用3个字节表示
python2文件中文编码
python2有2种方式声明字符集,推荐使用utf-8,在py文件第一行中加上字符集注释
官方推荐格式
# *-* coding:utf8 *-*
简化方式
# coding=utf8
python2字符串中文编码
对于字符串,默认仍是ascii,即使文件第一行声明了utf8编码
我们需要在创建字符串时,指定utf8编码,即在前面加u, 例如
变量 = u"字符串"