首页 >> 手游攻略

亚欧洲乱码视频一二三区

大家好,感谢邀请,今天来为大家分享一下亚欧洲乱码视频一二三区的问题,以及和听说你的程序又双乱码了的一些困惑,大家要是还不太明白的话,也没有关系,因为接下来将为大家分享,希望可以帮助到大家,解决大家的问题,下面就开始吧!

在我刚开始接触编程的时候,时不时就会遇到程序乱码问题。亦或是控制台输出乱码,亦或是数据库乱码,亦或是网页端显示乱码,总之乱码无处不在,它总是会在不应该出现的时间点出现在在不应该出现的位置。

那么乱码究竟是怎么回事呢,为啥好端端的文字就变成一堆乱七八糟的符号了呢?

这时如果你去网上搜索乱码问题,你就会发现大量的文章向你扑面而来,看完之后你更加郁闷了,还是不明其中缘由,今天我们就来探究下程序究竟为什么会乱码?

ASCII码

大家都知道计算机是从美国开始走向全世界的,最初的用途是服务于美国军方,用来帮助人类做一些复杂的数学运算,比如计算导弹弹道之类的。

后来随着计算机的发展,人们发现这个工具简直太好用了,事实再一次证明人类是多么的贪婪。他们有了更多的需求和欲望,比如想让计算机处理文字,控制打印机等。这时候就不像处理数学运算那么简单了,因为计算机内部都是0和1的二进制代码,怎么才能让计算机显示文字呢,于是发明计算机的大叔们搞了一个字符和数字的对应关系。我们知道虽然单词有很多个,但每个单词都是由26个字母组成的,区分大小写的话也才52个,1个字节8位可以有256种状态,再加上数字和一些标点符号1个字节也足够了。

于是那些大叔们把从0开始的32种状态规定了特殊的用途,比如打印机换行,彩色打印。然后又把数字、标点符号、大小写字母等逐一编码,直到编写到127号,也就是共计128个编码。最后给这张编码表起了个逼格很高的名字,叫「ASCII码」,也叫「美国信息交换标准代码」(AmericanStandardCodeforInformationInterchange)。

比如,小写字母a对应的ASCII码值是97,十六进制0x61;数字0对应的ASCII码是48,十六进制0x30。「ASCII码」是计算机编码的基石。后面所有的编码都是在此基础上完善的。

GBK编码

后来随着时代的不断发展,计算机在全球范围内开始普及。日本,俄罗斯,中国等很多国家都开始使用计算机,但其他很多国家用的并不是英文呀,比如我们中国的汉字,跟英文的字母简直是天壤之别,而且仅常用的汉字就要有3000+了,1个字节256种状态怎么够用呢。

于是聪慧的中国人民发明了我们自己的编码系统,用两个字节来表示一个汉字或者字符。第一个字节称为「高位字节」(也称区字节),第二个字节称为「低位字节」(也称位字节)。但这两个字节是有限制的,「高位字节」使用范围为0xA1-0xF7,「低位字节」使用范围为0xA1-0xFE。

这样我们就可以组合出大概8000个左右的汉字了,对于日常使用来说是足够了。这套编码规则就是「GB2312」。

你知道的,中国文化博大精深,区区8000个汉字怎么够用,很多少数民族也迫切希望用上计算机,很多人名依然无法识别,于是不在对高位字节和低位字节做限制,只要发现第一个字节大于127就认为这是一个汉字的开始,为什么要大于127呢,因为要兼容「ASCII码」呀,127以内说明是该字节表示的是「ASCII码」。

这样子2个字节15位大概可以表示65536-127个汉字。

然而香港和台湾并没有使用大陆的GBK编码规则,因为他们使用繁体字,所以就单独设计了一套自己的编码系统,叫做「Big5」表,也叫大五码或者五大码。

然后日本、韩国等不同国家也都设计了自己独有的编码规则,因为是各自独立设计,所以大概率不会出现一个字符在不同的编码系统中对应同一个数字。于是就会出出现乱码这种很诡异的现象。

比如,你的韩国女朋友给你发了一封电子邮件,里面的真实内容为「么么哒」,由于电子邮件是在韩国写的,所以计算机肯定是使用韩国的编码系统,假设这三个字对应的编码分别是0xA6B2、0xA6B2、0xC132;当你收到邮件之后,因为你是在国内所以肯定是使用GBK编码来解码,那么将三个编码转换为汉字之后发现是「分手吧」。

相信此时的你肯定是一脸懵逼,然后就又开始怀疑是不是自己做错了什么。

天下大统

为了解决各国编码不统一的问题,国际标准化组织制定了一套新的规则,叫做「Unicode码」,这套编码规则就厉害了,可以将全人类所有的字符都包含进去,包括人类走出非洲时的所使用的象形文字都可以包含进来。

那么如果要想包含这么多的字符进来的话,至少需要三个字节才可以,三个字节可以存储三百多万个字符,这应该可以覆盖所有文化的字符了吧,如果还不够的话,就用四个字节来表示一个字符,这样可以组合出大概21亿个字符,可能用到地球毁灭那一天都用不完。

可是随之而来的是另外一个问题,由于欧美大多使用英文,一个字节足以表示,现在让他们用三个字节,就造成了空间的巨大浪费。浪费率高达2/3,做过网络编程的小伙伴们都知道,在网络中数据的传输是需要很大的成本的,而且还不可靠,字节数越多,浪费的资源也就越多。

于是,在接下来的时间内,出现了多种「Unicode码」的具体编码方式,分别是UTF-8、UTF-16、UTF-32,其中UTF-8占用一到四个字节,UTF-16占用二到四个字节,UTF-32占用四个字节。显然UTF-8的设计更合理,欧美字符用一个字节来存储,中文或者其他字符用二个或者三个字节来存储,岂不美哉。

自此,天下大统。呃,不,是计算机编码得以大统,世上在无乱码。

总结

今天我们详细介绍了编码的历史,以及乱码的缘由,下次遇到乱码问题再也不慌了。

关于亚欧洲乱码视频一二三区,听说你的程序又双乱码了的介绍到此结束,希望对大家有所帮助。



本文由欣欣吧手游攻略栏目发布,感谢您对欣欣吧的认可,以及对我们原创作品以及文章的青睐,非常欢迎各位朋友分享到个人站长或者朋友圈,但转载请说明文章出处“亚欧洲乱码视频一二三区

标签:
亚当的六个女人
« 上一篇 2023-10-17