作者共发了6篇帖子。 字体大小:较小 - 100% (默认)▼  内容转换:不转换▼
 
点击 回复
153 5
锟斤拷
一派护法 十九级
1楼 发表于:2010-10-4 09:59
鍒板簳浠?拷涔堟椂鍊椤紑 锟斤拷锟斤拷   锟斤拷直锟斤拷锟   看到这些字句,您肯定会问,这是什么?这些字句是毫无实际意义的,但它们却形象地表达出了一些莫名其妙的问题。这是一个很经典的乱码。相当经典   最容易出现的地方就是搜索引擎
一派护法 十九级
2楼 发表于:2010-10-4 10:00
Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER   那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。   如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话   一个汉字2个字节,最终的结果就是:锟斤拷   我们上网的时候不用去关心网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比IE多得多。 乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”(百度,Google),它就是新老编码系统转换中出现的。网友est专门写了一篇文章来考证问题来源:   Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)”。
一派护法 十九级
3楼 发表于:2010-10-4 10:01
2010年8月14日中午,百度贴吧主页遭到疑似黑客攻击,也有可能是内部维修的错误,因此整个页面一直是锟斤拷等字,并持续大约3-4小时,这也让网友对“锟斤拷”这三个字产生了浓厚的兴趣,甚至出现了以“锟斤拷”为主题的签名档、头像和贴吧。 
一派护法 十九级
4楼 发表于:2010-10-4 10:01
一派护法 十九级
5楼 发表于:2010-10-4 10:01
一派护法 十九级
6楼 发表于:2010-10-4 10:01

回复帖子

内容:
抱歉,系统已内测完毕,本吧不能发帖
抱歉,系统已内测完毕,本吧不能发帖
用户名: 您目前是匿名发表
(快捷键:Ctrl+Enter)
 

本帖信息

点击数:153 回复数:5
评论数: ?
作者:巨大八爪鱼
最后回复:巨大八爪鱼
最后回复时间:2010-10-4 10:01
 
©2010-2024 Arslanbar Ver2.0
除非另有声明,本站采用知识共享署名-相同方式共享 3.0 Unported许可协议进行许可。