UTF-8和GB2312有什么不同?在什么情况下用?
答案:6 悬赏:50 手机版
解决时间 2021-05-08 21:39
- 提问者网友:欲劫无渡
- 2021-05-07 23:47
UTF-8和GB2312有什么不同?在什么情况下用?
最佳答案
- 五星知识达人网友:掌灯师
- 2021-05-08 00:28
不同的编码。 各个国家和地区所制定的不同 ANSI 编码标准中,都只规定了各自语言所需的“字符”。比如:汉字标准(GB2312)中没有规定韩国语字符怎样存储。这些 ANSI 编码标准所规定的内容包含两层含义: 1. 使用哪些字符。也就是说哪些汉字,字母和符号会被收入标准中。所包含“字符”的集合就叫做“字符集”。 2. 规定每个“字符”分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做“编码”。各个国家和地区在制定编码标准的时候,“字符的集合”和“编码”一般都是同时制定的。因此,平常我们所说的“字符集”,比如:GB2312, GBK, JIS 等,除了有“字符的集合”这层含义外,同时也包含了“编码”的含义。 “UNICODE 字符集”包含了各种语言中使用到的所有“字符”。用来给 UNICODE 字符集编码的标准有很多种,比如:UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。 1、ISO-8859-1:最简单的编码规则,每一个字节直接作为一个 UNICODE 字符。比如,[0xD6, 0xD0] 这两个字节,通过 iso-8859-1 转化为字符串时,将直接得到 [0x00D6, 0x00D0] 两个 UNICODE 字符,即 "ÖÐ"。反之,将 UNICODE 字符串通过 iso-8859-1 转化为字节串时,只能正常转化 0~255 范围的字符。 2、GB2312,BIG5,Shift_JIS,ISO-8859-2 把 UNICODE 字符串通过 ANSI 编码转化为“字节串”时,根据各自编码的规定,一个 UNICODE 字符可能转化成一个字节或多个字节。反之,将字节串转化成字符串时,也可能多个字节转化成一个字符。比如,[0xD6, 0xD0] 这两个字节,通过 GB2312 转化为字符串时,将得到 [0x4E2D] 一个字符,即 '中' 字。 “ANSI 编码”的特点: 1. 这些“ANSI 编码标准”都只能处理各自语言范围之内的 UNICODE 字符。 2. “UNICODE 字符”与“转换出来的字节”之间的关系是人为规定的。 3、UTF-8,UTF-16,UnicodeBig 与“ANSI 编码”类似的,把字符串通过 UNICODE 编码转化成“字节串”时,一个 UNICODE 字符可能转化成一个字节或多个字节。与“ANSI 编码”不同的是: 1. 这些“UNICODE 编码”能够处理所有的 UNICODE 字符。 2. “UNICODE 字符”与“转换出来的字节”之间是可以通过计算得到的。
参考资料: http://zhidao.baidu.com/question/10586905.html?fr=qrl
参考资料: http://zhidao.baidu.com/question/10586905.html?fr=qrl
全部回答
- 1楼网友:洒脱疯子
- 2021-05-08 03:46
UTF-8 代表的是国际 Gb2312 代表国内 也就是中文。。
- 2楼网友:人類模型
- 2021-05-08 02:26
通俗点:UTF-8 支持很过国家的语言,包括一些特殊符号(楼上几位没提到)。这个是GB2312做不到的!就是传说中出现乱码的典型。
Gb2312的话,就像楼上几为说的一样。对中文支持很好!
- 3楼网友:舍身薄凉客
- 2021-05-08 02:16
简单的说用UTF-8制作出来的网页可以显示 除了汉语外的国家文字(如:韩国、日本、英语等诸多国家的语言)
GB2312的网页只能显示汉语文字的别的想显示也显示不了!
- 4楼网友:人類模型
- 2021-05-08 01:48
在js文件中用utf-8,还有xml中,要不然会出乱码
用ajax返回xml时得用utf-8返回,不然取不到xml
地址栏传参时也utf-8这样中文才不会出现乱码,
gb2312做java开时用到的多一些
对中文件支持性好的是gb2312,可是不好处理
做程序开发时用一样的编码基本上不会出现乱码,注意转码就好了
- 5楼网友:爱难随人意
- 2021-05-08 00:44
UTF-8为国际标准支持几乎所有的语言
GB2312为中国的语言标准
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯