« 徐廉之 | 首页 | cxjmah »

Honeyhacker

个人主页: http://www.hi.baidu.Honeyhacker

留言(5 条)

字符编码笔记:ASCII,Unicode和UTF-8 留言:


引用Honeyhacker的发言:

或者这样说,两台主机通信的时候,A接收到B发送的消息后,它如何知道该报文采取的是什么编码类型?在报文的格式里面好像没有提到这一点吧!

已经弄明白了!不可一概而论!

字符编码笔记:ASCII,Unicode和UTF-8 留言:

或者这样说,两台主机通信的时候,A接收到B发送的消息后,它如何知道该报文采取的是什么编码类型?在报文的格式里面好像没有提到这一点吧!

字符编码笔记:ASCII,Unicode和UTF-8 留言:

原来如此!感谢你的回复!再问一个问题,从网络中抓获的数据报,在用wireshark分析的时候,如何判断其中的哪些数据使用了Unicode编码?(从snort给出的信息中,该条数据确实有Unicode编码)。

字符编码笔记:ASCII,Unicode和UTF-8 留言:

你在文中提到:“UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度”。我在http://dev.csdn.net/develop/article/83/83012.shtm上看到:
以下是Unicode和UTF-8之间的转换关系表:

U-00000000 - U-0000007F: 0xxxxxxx

U-00000080 - U-000007FF: 110xxxxx 10xxxxxx

U-00000800 - U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx

U-00010000 - U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

U-00200000 - U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

U-04000000 - U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
该文中明显说到UTF-8不限于四个字节。
请问得到1-4个字节的结论是从哪里找到的?

字符编码笔记:ASCII,Unicode和UTF-8 留言:

相当不错,这是我打算研究编码的时候看到的第一篇文章。几天之后再来评论!!