当前位置: Python基础教程 > 11-文件操作 > 阅读正文

python的文本编码

2021.6.23.   408 次   315字

在python不同版本中,使用了不同的编码字符集

  • python2 使用了 ASCII 字符集
  • python3 使用了 UTF-8 字符集

ASCII,仅有266个字符,一个ASCII字符在内存中占1个字节

UTF-8是通用字符集,包含了中文在内的几乎所有语言,大多数汉字使用3个字节表示

python2文件中文编码

python2有2种方式声明字符集,推荐使用utf-8,在py文件第一行中加上字符集注释

官方推荐格式

# *-* coding:utf8 *-*

简化方式

# coding=utf8

python2字符串中文编码

对于字符串,默认仍是ascii,即使文件第一行声明了utf8编码

我们需要在创建字符串时,指定utf8编码,即在前面加u, 例如

变量 = u"字符串"

本篇完,还有疑问?

加入QQ交流群:11500065636 IT 技术交流群