去年9月,twitter改版。
一个显著变化,就是URL加入了"#!"符号。比如,改版前的用户主页网址为
http://twitter.com/username
改版后,就变成了
http://twitter.com/#!/username
在我印象中,这是主流网站第一次将"#"大规模用于直接与用户交互的关键URL中。这表明井号(Hash)的作用正在被重新认识。本文根据HttpWatch的文章,整理与井号有关的所有重要知识点。
一、#的涵义
#代表网页中的一个位置。其右面的字符,就是该位置的标识符。比如,
http://www.example.com/index.html#print
就代表网页index.html的print位置。浏览器读取这个URL后,会自动将print位置滚动至可视区域。
为网页位置指定标识符,有两个方法。一是使用锚点,比如<a name="print"></a>,二是使用id属性,比如<div id="print" >。
二、HTTP请求不包括#
#是用来指导浏览器动作的,对服务器端完全无用。所以,HTTP请求中不包括#。
比如,访问下面的网址,
http://www.example.com/index.html#print
浏览器实际发出的请求是这样的:
GET /index.html HTTP/1.1
Host: www.example.com
可以看到,只是请求index.html,根本没有"#print"的部分。
三、#后的字符
在第一个#后面出现的任何字符,都会被浏览器解读为位置标识符。这意味着,这些字符都不会被发送到服务器端。
比如,下面URL的原意是指定一个颜色值:
http://www.example.com/?color=#fff
但是,浏览器实际发出的请求是:
GET /?color= HTTP/1.1
Host: www.example.com
可以看到,"#fff"被省略了。只有将#转码为%23,浏览器才会将其作为实义字符处理。也就是说,上面的网址应该被写成:
http://example.com/?color=%23fff
四、改变#不触发网页重载
单单改变#后的部分,浏览器只会滚动到相应位置,不会重新加载网页。
比如,从
http://www.example.com/index.html#location1
改成
http://www.example.com/index.html#location2
浏览器不会重新向服务器请求index.html。
五、改变#会改变浏览器的访问历史
每一次改变#后的部分,都会在浏览器的访问历史中增加一个记录,使用"后退"按钮,就可以回到上一个位置。
这对于ajax应用程序特别有用,可以用不同的#值,表示不同的访问状态,然后向用户给出可以访问某个状态的链接。
值得注意的是,上述规则对IE 6和IE 7不成立,它们不会因为#的改变而增加历史记录。
六、window.location.hash读取#值
window.location.hash这个属性可读可写。读取时,可以用来判断网页状态是否改变;写入时,则会在不重载网页的前提下,创造一条访问历史记录。
七、onhashchange事件
这是一个HTML 5新增的事件,当#值发生变化时,就会触发这个事件。IE8+、Firefox 3.6+、Chrome 5+、Safari 4.0+支持该事件。
它的使用方法有三种:
window.onhashchange = func;
<body onhashchange="func();">
window.addEventListener("hashchange", func, false);
对于不支持onhashchange的浏览器,可以用setInterval监控location.hash的变化。
八、Google抓取#的机制
默认情况下,Google的网络蜘蛛忽视URL的#部分。
但是,Google还规定,如果你希望Ajax生成的内容被浏览引擎读取,那么URL中可以使用"#!",Google会自动将其后面的内容转成查询字符串_escaped_fragment_的值。
比如,Google发现新版twitter的URL如下:
http://twitter.com/#!/username
就会自动抓取另一个URL:
http://twitter.com/?_escaped_fragment_=/username
通过这种机制,Google就可以索引动态的Ajax内容。
(完)
fisio 说:
Gmail 这样用多少年了哇
2011年3月 9日 02:21 | # | 引用
partita 说:
老大……Facebook已经用#!好久了:
http://velocityconf.com/velocity2009/public/schedule/detail/7611
里面讲到的Quickling/PageCache就是用#!和XHR实现的。
2011年3月 9日 03:47 | # | 引用
gsid 说:
只希望阮兄多多发文
2011年3月 9日 09:34 | # | 引用
宇义 说:
最后关于google的那个说明很有用~
2011年3月 9日 10:18 | # | 引用
killvin 说:
这对于ajax应用程序特别有用,可以用不同的#值,表示不同的访问状态,然后向用户给出可以访问某个状态的链接。
这是什么意思?
2011年3月 9日 10:46 | # | 引用
fanfan 说:
好像在HTML5中有新的方法来改变URL地址栏而不用重新load页面
2011年3月 9日 11:11 | # | 引用
卡布奇诺 说:
阮哥!能不能分享下你关注的英文站点?特别是有关it技术的 谢谢
2011年3月 9日 11:30 | # | 引用
Rei 说:
有个疑问,浏览器请求不是不包括#后面的么,为什么用
http://twitter.com/#!/username
能正确打开用户页面呢?
2011年3月 9日 12:24 | # | 引用
donkie 说:
重点没讲到。
http://twitter.com/#!/username
有此可知,twitter.com是用Ajax方式加载页面个性化内容的。
2011年3月 9日 17:08 | # | 引用
Ruan YiFeng 说:
用户内容都是ajax方式生成的。所以,twitter页面需要浏览器两次抓取(第一次是html网页,第二次才是用户的发言内容),这就是为什么twitter比facebook的载入时间长得多的原因。
就是说,ajax程序可以利用这一点,根据不同的#值,在同一个页面上呈现不同结果。
2011年3月 9日 17:59 | # | 引用
Ruan YiFeng 说:
我觉得Hacker News上面值得看的东西很多。
2011年3月 9日 18:00 | # | 引用
darasion 说:
有没有关于使用hashchange载入ajax内容时,保存历史记录相关的技术??最近对这个特感兴趣。
2011年3月 9日 18:42 | # | 引用
shector 说:
更多相关讨论链接 http://pelegri.wordpress.com/2011/02/13/readings-on-hash-bang/
2011年3月 9日 23:14 | # | 引用
colordancer 说:
楼上有几位朋友的意思,是不是说阮老师只能写一些所有人不知道的东西?
2011年3月10日 10:35 | # | 引用
maker 说:
good,这个技术最近被很多人提到过。
2011年3月10日 11:11 | # | 引用
Gary 说:
在我的博客上也用了类似的功能来实现ajax加载。
2011年3月10日 15:02 | # | 引用
lonpo 说:
嗯~~~~你的博客不错哦~~~我收藏了,整使用了这种方式,回头我也去整一个插件!
2011年3月11日 09:57 | # | 引用
花心开未 说:
如果日本福岛核电站核泄漏,距离上是否会对上海造成影响一
2011年3月12日 04:03 | # | 引用
Jason 说:
受教了,非常感谢,哈哈
2011年3月15日 11:59 | # | 引用
高天蒲 说:
gmail早都是了
2011年3月29日 17:00 | # | 引用
wxianfeng 说:
从头看到尾 学到了
八、Google抓取#的机制
2011年4月14日 09:47 | # | 引用
酱油 说:
手上项目正好要求用这个技术,博主能给个示例link不,谢了
2011年10月24日 15:24 | # | 引用
NinoFocus 说:
我记得 jQuery history plugin 这个插件可以支持各个浏览器的前进后退按钮
2011年11月29日 17:31 | # | 引用
3qsami 说:
文章很详细,作为初学者,第一点对我的作用可谓举足轻重。
看完还是有一个疑问需要阮老师指点一二。文中说“(#)为网页位置指定标识符,有两个方法。一是使用锚点,比如,二是使用id属性,比如。”,那换句话说就是,如果我想指定跳转的地方,它网页的源代码中没有锚点或者id属性的话,用#进行定位就是不可能的了?
2012年1月30日 12:07 | # | 引用
3qsami 说:
请教:如果网页的源代码中没有锚点或者id属性,是不是就不能用#号来定位了?
2012年1月31日 12:21 | # | 引用
Clam 说:
发现了个问题,如果sever端301跳转,发现在chrome中,井号的东西是携带的,比如/view/1#2,server端要求跳转到/view/1.htm,则在chrome中会自动加上跳转前的井号的内容,会跳到/view/1.htm#2,而在IE内核中就不会,不知道这个有没有什么规范
2012年4月17日 14:29 | # | 引用
YuC 说:
HTML5中可以使用History API支持这一特性,GitHub已经用上了
2013年4月 2日 14:04 | # | 引用
yujiaao 说:
好文,有用!
2013年5月13日 11:08 | # | 引用
meng 说:
不知道百度的蜘蛛 会不会抓取#!符号呢?
2013年8月14日 14:17 | # | 引用
y 说:
您人民币付款页面的提示信息:“由于业务调整,收款主页已于2014年5月4日起停止服务,感谢您一直以来的支持!点此了解详情”
看来您需要更换二维码了
2014年5月 4日 14:59 | # | 引用
Lynnic 说:
我想在当前页的中设置一个跳转,使地址栏后加上#anchor并重载当前页,该怎么实现呢?
2014年11月15日 22:29 | # | 引用
Tank 说:
好文!
2015年7月 7日 13:42 | # | 引用
it民工 说:
总结的很细致,学习了,谢谢
2016年2月16日 11:51 | # | 引用
张志伟 说:
http://www.cnblogs.com/yeer/archive/2013/01/21/2869827.html
阮老师,感觉这篇文章完全是抄袭你的呀,而且还不留出处。
2016年4月20日 09:27 | # | 引用
小马 说:
那如果URL中既有#,现在要通过url传值,后面拼接一个?code=1,这样的话?和#都能发挥预期的作用吗?
也就是说#和?有没有先后顺序
2017年3月13日 15:29 | # | 引用
路过 说:
url的#并没有定位到指定位置,可能有哪些原因?
2017年9月23日 10:07 | # | 引用
flcwl 说:
请问大佬有没有url中 get请求 query参数和 #锚点 共存的情况。如果有 # ? 的顺序是怎样的?
http://abc.com/?id=77&name=abc#page1
或
http://abc.com/#page1?id=77&name=abc
2018年6月30日 11:02 | # | 引用
关中刀客在青岛 说:
多年后我路过了阮大神曾经的家园
2019年8月29日 11:35 | # | 引用
BobDu 说:
https://developers.google.com/search/docs/ajax-crawling/docs/getting-started?csw=1
https://developers.google.com/search/blog/2015/10/deprecating-our-ajax-crawling-scheme.html
这个方案已经被弃用了。。。。谷歌现在支持了爬虫渲染ajax
2021年6月15日 14:37 | # | 引用