B站视频:https://www.bilibili.com/video/BV1Wv4y1P76d
U管视频:https://www.youtube.com/watch?v=DxThZept6Aw
互联网创立之初只使用英文字母.为什么呢?因为它是美国人发明的.当然只有英文字母了.(好像是废话)
为了全世界用户更好的使用互联网,人们终于在互联网域名中引入了IDN域名,即国际化域名.
国际化域名是以英美西方人视角来定义的,对他们来说,英文字母是本地化的,国际化即指(非本地的)非英文字母的文字…
因此国际化域名即指中文汉字,倭语字母,希腊字母,印度字母… 地球上所有非英文字母的文字字符.
当然在此要温馨提醒一下,中文世界里的国际域名是指com, net, org三大元老TLD.这三个TLD,英语里叫gtld(通用顶级域名)…
我之前使用shenjiaming.com建站,由于字母太长很容易打错拼写,于是前两个月注册了中文域名即IDN域名:佳明.cn.现在本站已经正式启用了中文域名佳明.cn…
佳明.cn网站概览
不得不说,现在使用佳明.cn,网址栏非常醒目直观,毕竟是中文嘛~~
让我们看看在搜索引擎中佳明.cn的收录情况.
GOOGLE收录佳明.cn
YAHOO收录佳明.cn
BING收录佳明.cn
在三大著名美国搜索引擎GOOGLE, BING, YAHOO中均收录了中文(IDN)域名网站:佳明.cn.网址栏都能正确显示IDN(中文)域名的正确形式.
国产搜索引擎百度对IDN(中文域名)不予支持,但予以收录对应的ASCII码形式域名
国内百度一家独大,所以我们只讨论百度.由于佳明.cn是个新站,百度因此暂未收录.不过我们可以观察别的中文域名(IDN域名)网站,可以发现:
百度不能正确显示中文(IDN)域名,只能显示中文(IDN)域名对应的ASCII码形式
原来,IDN域名为了兼容老旧的linux,它在linux中并未采用UNICODE,而是使用一种punycode算法,将IDN/中文域名转化为ASCII(英文字母)形式,例如:佳明.cn转换为xn--qrqy46c.cn.人类是看不懂这串乱码的,但是浏览器解析乱码域名xn--qrqy46c.cn时,会在地址栏转换并正确显示IDN域名:佳明.cn(注:台式电脑浏览器基本均能正确转换,手机或平板的浏览器大部分太菜了,不会转换).
百度如果收录就会收录这个乱码域名xn--qrqy46c.cn而不是佳明.cn.
结论:讽刺的是,美国搜索引擎支持IDN(中文)域名;中文搜索引擎百度不支持IDN(中文)域名,只支持IDN(中文)域名对应的ascii形式域名(形如乱码)
到这里就该结束了.但是最后就让佳明做个实验吧.表中搜索语法是查询对应顶级域名在搜索引擎中收录有多少项结果.统计时间:2022-5-28 15:21:15
搜索引擎指令 | bing | yahoo | baidu | |
site:中国 | 约 535,000 条结果 | × | 約561,000件 | × |
site:xn--fiqs8s(等价site:中国) | 同上 | 819项结果 | 同上 | 约109,000个 |
site:网络 | 约 226,000 条结果 | × | 約238,000件 | × |
site:xn--io0a7i(等价site:网络) | 同上 | 103项结果 | 同上 | 约33个 |
site:公司 | 约 340,000 条结果 | × | 約357,000件 | × |
site:xn--55qx5d(等价site:公司) | 同上 | 215项结果 | 同上 | 约4,020个 |
注:.中国,.网络,.公司是全球最早也是中国最早最权威的三大纯中文顶级域.其他纯中文顶级域还有很多,例如.网站,.移动,.我爱你,.广东,.佛山…此处不再一一举例赘述了.
从我汇总的表中可以看出,只有google和yahoo对IDN域名网站支持较好,bing和baidu非常差.bing有情可原,它毕竟是美国公司……