首先我们新建一个文本文档,在里面输入“联通”之后保存并退出。

再打开之后,本来的联通就变成了一堆乱码。

这是因为原本Windows默认编码是GBK,但是由于联通的GBK编码是C1 AA CD A8=1100 0001 1010 1010 1100 1101 1010 1000
刚好与UTF-8的两字节模板一致,所以计算机误以为是UTF-8编码的,就会以UTF-8编码形式打开,自然会出现问题,这时候我们可以把文件另存为,把存储时的编码改为uTF-8就不会出现问题了。乱码问题就解决了。
这就是为什么文本文档在utf-8的模式下会在所有文本的最前面增加一个BOM字符的原因, 就是用来区分一些极端情况导致的编码方式识别出错。

分类: others

0 条评论

发表回复

Avatar placeholder

您的电子邮箱地址不会被公开。 必填项已用 * 标注