Madman · 2018-01-02T04:30:00Z Python 陷阱|第1章:字符编码问题 (Decode)将二进制字节序列解码成 Unicode code points,(Encode)将 Unicode code points 编码成二进制字节序列 ASCII Unicode UTF-8 str byte
Madman · 2018-01-01T01:30:00Z Unicode 字符集与 UTF-8 编码系统 Unicode 只是包含了所有语言符号、图形符号等的统一字符集(character set,每个字符都有唯一的 Unicode code point),但它并没有规定字符在计算机内部或网络中如何进行存储和传输,即它不是一个编码系统(encoding)。UTF-8 / UTF-16 / UTF-32 分别都实现了将 Unicode 字符编码成由 0 或 1... ASCII BOM GBK Unicode UTF-16 UTF-32 UTF-8