user-agent相关内容

是否可以在一行中列出多个用户代理?

是否可以在 robots.txt 中向多个机器人发出一条指令而不必重复提及? 示例: 用户代理:googlebot yahoobot microsoftbot禁止:/无聊的东西/ 解决方案 实际上很难给出明确的答案,因为 robots.txt 没有一个非常明确的标准,而且很多那里的文档含糊不清或相互矛盾. Google 漫游器可理解的格式说明是相当全面,包括这个稍微有点乱的句子: ..
发布时间:2021-09-15 18:56:02 其他开发

浏览器的 User-Agent 字符串的标准格式是什么?

是否有用于创建用户代理字符串的 RFC、官方标准或模板?iphone 的用户代理字符串看起来很奇怪... Mozilla/5.0(iPhone;U;CPU iPhone OS 3_1_2,如 Mac OS X;en-us)AppleWebKit/528.18(KHTML,如 Gecko)版本/4.0移动/7D11 Safari/528.16 解决方案 User-Agent 标头是 R ..
发布时间:2021-09-15 18:55:59 其他开发

如何在 python-twitter 中设置 User-Agent?

我正在编写一个小脚本来发送来自监控系统的消息.到目前为止我遇到的唯一问题是我无法正确设置用户代理,所有推文都显示为“来自 API",这没什么大不了的,但我想知道我做错了什么.重现此行为的示例: 导入系统导入推特用户名=“推特用户"密码=“推特密码"api = twitter.Api(用户名=用户名,密码=密码)api.SetUserAgent("监控")api.SetXTwitterHeader ..
发布时间:2021-09-11 18:47:05 Python

如何以编程方式在 Swift 中请求桌面站点(没有 UIWebView)?

桌面站点的 HTML 代码在标题中有一个“apple-touch-icon"缩略图链接,而移动站点没有.我只需要获取这个 html 并解析. 那么,如何请求桌面站点(可能通过 URLRequest、URLSession 或其他方式)? 附言我发现,我必须更改 User-Agent 字符串值,但同样,我没有找到,如何在 Swift 中执行此操作. 解决方案 取决于服务器逻辑,但在 ..
发布时间:2021-09-07 19:16:02 移动开发

在 Selenium 中通过 webdriver 传递用户代理

我正在使用 Python 中的 Selenium 进行网站抓取项目.当我通过浏览器打开主页时,它可以正常打开. 但是,当我尝试通过 Selenium 中的 webdriver() 打开网页时,它打开了一个完全不同的页面. 我认为,它能够检测到user-agent(不确定它叫什么)并且能够检查浏览器的属性或其他东西. 是否可以通过 webdriver() 传递属性以便加载正确的主页 ..
发布时间:2021-07-17 18:41:24 Python

Python - 无法在 Scrapy 中动态旋转 userAgent

我覆盖了scrapy模块HttpProxyMiddleware和UserAgentMiddleware的默认实现,我自己的scrapy实现轮换了用户代理和IP地址,它从提供的清单.每个请求的 IP 都在变化,但用户代理没有变化.我无法弄清楚原因. 这是我对类的实现 RotateUserAgentMiddleware 类 RotateUserAgentMiddleware(UserA ..
发布时间:2021-07-16 22:18:56 Python

试图伪造和轮换用户代理

我正在尝试伪造用户代理并在 Python 中轮换它们. 我在网上找到了一个关于如何使用 scrapy-useragents 包使用 Scrapy 执行此操作的教程. 我抓取了网页 https://www.whatsmyua.info/,以检查我的用户代理看看它是否与我的不同,以及它是否旋转.它与我的实际用户代理不同吗,但它不会轮换它每次都返回相同的用户代理,我无法弄清楚出了什么问题. s ..
发布时间:2021-07-16 22:10:12 Python

什么是三星 s3 用户代理?

我想知道三星 Galaxy S3 的用户代理是什么. 我没有设备,所以无法测试自己.用户代理将被我的网络服务器识别. 解决方案 Mozilla/5.0 (Linux; U; Android 4.0.4; en-gb; GT-I9300 Build/IMM76D) AppleWebKit/534.30 (KHTML, like Gecko)版本/4.0 Mobile Safari/53 ..
发布时间:2021-07-14 20:02:38 其他开发

新的 Safari 7 用户代理字符串

我真的不想在这里打扰您,但由于我没有 Mac,我无法对此进行测试. 我做了一个浏览器嗅探类(我知道它很糟糕,但它运行良好,不是重点). 这一切正常,但是我的同事说我最近做的一个网站上有一个错误.我想知道/看到的是是否有任何网站的链接记录了 Safari 7 用户代理字符串/原始,或者是否有人可以在此处发布 Safari 7 UA 字符串 ($_SERVER['HTTP_USER_AGE ..
发布时间:2021-07-14 19:24:19 其他开发

Rails 3:HTTP_USER_AGENT

我正在努力检测站点上的技术支持用户代理,这样用户就不需要自己找到它.这是我到目前为止所得到的,但无论我在什么浏览器上测试它都显示为默认的“未知"关于我哪里出错的任何建议? def 网络浏览器mybrowser = ENV["HTTP_USER_AGENT"]案例我的浏览器当/MSIE 8.0/然后是“Internet Explorer V8"当/MSIE 7.0/然后是“Internet Exp ..
发布时间:2021-07-13 18:34:17 其他开发

如何在 ruby​​ 中设置自定义用户代理

我的任务是通过自动化测试 URL 上的不同用户代理.我正在使用 ruby​​ 进行编码,并且我一直在尝试使用以下方法设置用户代理,但它似乎无法识别用户代理. @http = Net::HTTP.new(URL)response = @http.request_get(URL, {'User-Agent' => useragent}) 有没有其他方法可以做到这一点,或者我做错了什么? 解决 ..
发布时间:2021-07-11 19:39:40 其他开发

Rails 浏览器检测方法

大家好,我想知道业界在 Rails 中进行浏览器检测的标准方法是什么?是否有可以帮助确定浏览器并将类或 id 应用于 (X)HTML 的 body 元素的 gem、库或示例代码?谢谢,我只是想知道每个人都使用什么以及是否有公认的方法? 我知道我们可以获取 user.agent 并解析该字符串,但我不确定这是否是进行浏览器检测的可接受方式. 另外,我不是想在这里讨论特征检测,我已经在 S ..
发布时间:2021-07-11 18:44:10 其他开发

robots.txt 中的 User-Agent 行是完全匹配还是子字符串匹配?

当爬虫读取 robots.txt 文件的 User-Agent 行时,它是尝试将其与自己的 User-Agent 完全匹配还是尝试将其作为其 User-Agent 的子字符串进行匹配? > 我读过的所有内容都没有明确回答这个问题.根据另一个 StackOverflow 线程,这是完全匹配的. 然而,RFC 草案让我相信这是一个子字符串匹配.例如,User-Agent: Google 将匹 ..
发布时间:2021-07-10 19:17:44 其他开发

robots.txt 中的指令顺序,它们是相互覆盖还是相互补充?

用户代理:Googlebot禁止:/privatedir/用户代理: *不允许:/ 现在,Googlebot 不允许使用哪些内容:/privatedir/或整个网站/? 解决方案 根据原版robots.txt规范: 机器人必须遵循与其用户代理名称匹配的第一条记录. 如果这样的记录不存在,它必须跟在带有User-agent: *的记录后面(这一行不能出现在多个记录中). ..
发布时间:2021-07-10 19:17:18 其他开发