Python 陷阱|第1章:字符编码问题
(Decode)将二进制字节序列解码成 Unicode code points,(Encode)将 Unicode code points 编码成二进制字节序列
(Decode)将二进制字节序列解码成 Unicode code points,(Encode)将 Unicode code points 编码成二进制字节序列
Unicode 只是包含了所有语言符号、图形符号等的统一字符集(character set,每个字符都有唯一的 Unicode code point),但它并没有规定字符在计算机内部或网络中如何进行存储和传输,即它不是一个编码系统(encoding)。UTF-8 / UTF-16 / UTF-32 分别都实现了将 Unicode 字符编码成由 0 或 1...