关于这个符号。。。。估计大家也没少见,第一次见的可能也猛一下不知所以然。其实我也是今天才后知后觉地注意到这个东西,然后就顺便把它解剖了。另外考虑到最初试图用各种关键字组合向谷歌度娘求教都未果,所以把个人研究过程和成果码出来供大家交流学习。
(注:文中为防止涉及编码被浏览器自动转换为符号,全部采用了全角字符,自行实验时需要用半角。)
1、收到这个字符后我先保存成了Unicode编码的txt文档,无意间瞥见这货大小居然是118字节,瞎了;
2、直接拷去问谷哥,谷哥表示这货尺寸太长了他受不了,再拿去问度娘,度娘表示她也没那么深不可测;
3、把&#3657写入txt保存成html后用浏览器打开,是一个这个符号:้,当时觉得很纳闷;
4、换搜搜,有重大发现,那个符号被转成了ส和一连串的้
5、取一个ส和两个้组成字串写入txt,保存成html后打开,即出现了一个“ส”头上喷射出两层“波”的符号:ส้้,删掉一个&#3657,波变成一层了:ส้,后实验表明,ส是ส的编码,ส后面跟几个&#3657,它就能喷几层波;
6、接着问谷哥&#3626是神马,谷歌表示这好像是泰文符号,于是真相大体清楚了:ส等是泰文符号,估计是在泰文中会根据种种基于语法等方面的需求,在这类符号上面加一些东西(可能类似我们的汉语拼音声调),因此采用这种编码识别方式。之于它喷得太远了这个问题,猜是因设计者没考虑限定符号头上”戴帽子“的数量而延续下来的Bug吧。
7、发散思维,知道了这个原理,通过在txt文本中修改编码和后缀数,也可以DIY中各种各样的喷射符:ส็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็
ส้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้