文章在分类 '文字处理'中。

作者:吴军
我们还是看上回的例子,查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词的网页(详见关于布尔运算的系列)。现在任何一个搜索引擎都包含几...

ruanyf 发表于 2006年08月13日

Technorati 标签:

作者:不详
gb系列如:gb2312,gbk和gb18030。
GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字 区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768...

ruanyf 发表于 2006年07月10日

Technorati 标签: ,