通八洲科技

Python3编码如何实现相互转化?

日期:2025-12-01 00:00 / 作者:冷炫風刃
字符串与字节转换需用encode()和decode()方法;str转bytes用s.encode('utf-8')或s.encode('gbk'),如"你好".encode('utf-8')得b'\xe4\xbd\xa0\xe5\xa5\xbd';bytes转str用b_data.decode('utf-8'),如b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8')得"你好";编码不匹配会抛UnicodeDecodeError,可用errors='ignore'跳过或errors='replace'替换错误字节,编码时也可设errors处理非法字符;保持编码一致并妥善处理异常即可确保转换稳定。

Python3中字符串和字节之间的编码转化主要涉及strbytes类型。不同编码如UTF-8、GBK等可以按需转换,核心方法是使用encode()decode()函数。

字符串转为字节(编码)

将文本内容从str类型转为bytes类型时,需要指定编码格式:

  • s.encode('utf-8'):把字符串按UTF-8编码成字节
  • s.encode('gbk'):使用GBK编码,适用于中文环境

例如:

text = "你好" b_data = text.encode('utf-8') # 结果:b'\xe4\xbd\xa0\xe5\xa5\xbd'

字节转为字符串(解码)

bytes还原为可读的str,必须使用与编码一致的格式:

  • b_data.decode('utf-8'):按UTF-8解码字节数据
  • b_data.decode('gbk'):处理GBK编码的字节流

例如:

b_data = b'\xe4\xbd\xa0\xe5\xa5\xbd' text = b_data.decode('utf-8') # 结果:"你好"

处理编码错误

当字节流与指定编码不匹配时会抛出UnicodeDecodeError。可通过参数控制容错行为:

  • .decode('utf-8', errors='ignore'):跳过无法解码的字节
  • .decode('utf-8', errors='replace'):用替换错误部分

同样,编码时也可使用errors参数处理非法字符。

基本上就这些。只要注意编码一致性,并合理处理异常情况,转换过程就很稳定。