文本乱码经验总结
发布日期:2021-09-01 18:44:40 浏览次数:7 分类:技术文章

本文共 468 字,大约阅读时间需要 1 分钟。

  hot3.png

概述

做中文的程序经常会遇到乱码的问题。汉字编码有国标GB2312,CJK,UTF8,最让人头疼了。本文试着总结出几个常见的乱码情形和解决方法。

GBK as ISO8859

如图中第一种情况,你会看到原本是汉字的字符变成了好多你不认识的西欧字符。还能救,将文本重新用GBK读取就行了。

GBK as UTF8

这是最危险的,UTF8的字符集相当的宽阔,这时候你会看到一个个的方框,或者菱形+问号。 能不能救要看运气,1)如果gbk流已经用utf8编解码另存过了,挽救的机会小,即便反向的编解码也不能得到完整的原文。2)如果只是在输出到客户端的时候“显示”出错,那么只需要重新调整字符集设置就能得到正确的显示。

UTF8 as GBK

这种情况下你会看到好多不认识的汉字,至少他们都是汉字,能够显示出来。将文件重新用UTF8读取就正常了。

锟斤拷

无药可救了。流在GBK和UTF8之间进行了2次以上的错误转码。

![4中乱码形式][1] [1]:

转载于:https://my.oschina.net/lxbzj/blog/370702

转载地址:https://blog.csdn.net/weixin_34124651/article/details/91689835 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:SQL server数据库的备份和还原
下一篇:htnl之CSS的使用讲解

发表评论

最新留言

留言是一种美德,欢迎回访!
[***.207.175.100]2024年03月28日 04时18分01秒