前言:
这篇文章我想了很久,不知道该不该发布,但是为了让更多的SEOer了解点击量和搜索引擎,未央代表未央宫的兄弟们,在五一假期发布了。希望在做SEO优化的时候给你一些启发。接下来,干货开始!
当你点击百度搜索结果的链接,你会被带到一个第三方网页。这个简单的过程其实挺复杂的,那么你知道这几百毫秒发生了什么吗?SEO章会带你去探索。
记录点击行为
这个过程是通过调用w.gif的一个像素图片来完成的,这个图片会传递一些参数,如下图所示。
点击结果后,将点击信息传递给百度
这里的搜索词是“SEO章”,点击的结果是“百度索引”。网址是中间页面的链接。在这个环节?Url=稍后将使用以下值。Path是百度当前结果页面的地址。另外,资源id为1599,表示是自然搜索结果。
至此,百度已经获得了点击信息。
从引用中剥离参数wd
接下来百度会进行进一步的操作,将用户搜索到的关键词隐藏起来。例如,如果我在百度搜索谷歌,网址将是https://www.baidu.com/s? wd =谷歌
当我点击第一个谷歌香港结果时,我会跳转到百度的一个中间页面。这个中间页面的网址是:
https://www.baidu.com/link? URL = _ qztpxb2 yx6i 8 ovjybeol 7 dexwdmejiegwsqkz-38ggfi 93 vamdx 5 ncxor-ayz & amp;wd = & ampeqid = 9 FD 2c 68 f 0006060 f 00000045 ADC 8632
百度在请求这个中间页面时,会使用中间页面的URL作为引荐者的URL。点击时不生成URL,点击时给出推荐人的URL。你会发现wd=之后的值是空,关键字信息放在wd之后,这也是你在Google Analytics中看不到用户关键字的原因。
至此,百度已经“保护了用户的隐私”。
一个新窗口打开中间页面
第三步是在一个新窗口中打开这个中间页面。至于为什么不像Google或者Bing那样在原窗口打开,跟中国网民的习惯有关。至少从有target = "_ blank的那一年开始,国内的搜索引擎就一直这样玩。可能检索效率不高,需要回到其他结果或者使用其他搜索词。但是由于新打开的窗户,存在一些安全隐患,我们后面会详细描述。这中间一页基本上就是一个剧本。格式化后,请参见下图:
点击后百度搜索中间页面脚本
正如我们所看到的,这个脚本使用window.location.replace跳转到目标URL。这是常见的JS跳转。
此时,百度已经打开了一个新的窗口,将带你进入目的网页。
验证点击真实性
我们注意到,百度在这个中间页面里叫window . opener . BDS . PDC . sendlinklog();回到搜索结果页面,我们会发现这个页面调用了一个JS。详见下图:
JS的重要作用是验证点击的真实性
我们看到这个请求发送中间页面的字符串参数作为url值。如果没有这样的请求,以前也没有w.gif的请求,那么这个点击很可能是假的。虽然虚假的模拟点击无法消除,但是很多爬行动物和低级的虚假点击很大程度上被过滤掉了。
至此,百度为点击数据的真实性加了“双保险”。
安全剥离开启器
在中间页面代码的末尾,我们看到window.opener = null如果没有添加这一行代码,那么跳转到目标页面后,目标页面可以用window.opener对百度搜索结果页面进行各种操作,虽然新规范HTML中增加了属性rel=noopener以避免给opener赋值,但旧浏览器不支持。老浏览器只支持noreferrer,百度却骄傲的告诉目标页面“这是我妈发给你的免费流量”。总之,这就造成了安全隐患。在脚本的末尾,出于安全原因,给开启者分配了值空,同时保留了referrer。
至此,百度准备带你去目标页面。
跳转到目标页面
经过以上五步,百度终于可以带你到目标页面了。这个页面是在一个新的窗口,所以它不能得到访问者搜索的搜索词,也不能操作打开它的百度搜索结果页面窗口。
至此,未央已经介绍完毕。
介绍百度的点击是为了说明百度确实对数据和安全有全面的考虑。作为SEO,要尽量从根源入手,避免做一些吃力不讨好的事情来欺骗引擎。
1.《百度点击 百度是如何记录点击行为的?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《百度点击 百度是如何记录点击行为的?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/jiaoyu/1402733.html