如何检测如果游客是人,而不是一个蜘蛛 [英] How to detect if a visitor is human and not a spider

查看:172
本文介绍了如何检测如果游客是人,而不是一个蜘蛛的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我登录到我的网站每次访问,并确定如果游客是人是很重要的。我已经在网上搜索,发现了如何检测是否访问者是人类许多有趣的想法。

I am logging every visit to my website and determining if the visitor is human is important. I have searched the web and found many interesting ideas on how to detect if the visitor is human.


  1. 如果访问者登录并通过验证码

  2. 检测鼠标事件

  3. 检测,如果用户具有浏览器[用户代理]

  4. 检测鼠标点击[我怎么会去呢?]

还有没有其他的万无一失的方法来检测,如果游客是人类?

Are there any other surefire ways to detect if the visitor is human?

推荐答案

您需要持久的机器人,以及讨厌的数据偷窃盗版机器人。以及beheaved法律之间distingish

You need to distingish between well beheaved law abiding robots, and, nasty data thieving piratical robots.

尼斯机器人将读取机器人meta标签,并符合你的政策。 没有索引'是拒绝任何thier服务的一种礼貌的方式。

Nice robots will read the 'Robots' meta tag and comply with you policy. 'no index' being a polite way to refuse any of thier services.

在另一方面恶意机器人将假的的UserAgent等类似的标题。

Malicious robots on the other hand are going to fake any "UserAgent" and similar headers.

验证环节可能是最好的方法,但他们可以P * SS掉非机器人如果超过使用。

Captchas are probably the best method but they can P*ss off non robots if over used.

我看到一个鬼鬼祟祟的方法是有一个递归链接的页面上的第一个链接,将履带送入一个循环。另一种是有一个链接,你不喜欢在页面上的第一个链接来分散机器人关注的网站。这两个环节很容易被译为invisable以肉食代理。

One sneaky method I have seen is to have a recursive link as the first link on the page which will send the crawler into a loop. Another is to have a link to a site you dislike as the first link on the page to distract the robots attention. Both these links can easily be rendered "invisable" to meat based agents.

这篇关于如何检测如果游客是人,而不是一个蜘蛛的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
相关文章
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆