mechanize 第8页 - IT屋-程序员软件开发技术分享社区

Ruby机械化带标头的帖子

我有一个包含js的页面，这些页面通过XMLHttpRequest和服务器端脚本发布数据，请检查此标头，如何发送此标头? agent = WWW::Mechanize.new { |a| a.user_agent_alias = 'Mac Safari' a.log = Logger.new('./site.log') } agent.post('http://site.com/bo ..

发布时间：2020-05-08 01:03:54 ruby xmlhttprequest mechanize 其他开发

如何使用机械化获取生成的验证码图像

我正在尝试使用python和机械化从我的移动服务提供商网站发送短信. 问题在于表单具有验证码图像.使用机械化可以获取图像的链接，但是访问该链接的时间总是不同的. 有什么办法可以从机械化过程中获得准确的照片吗? 解决方案这是如何获取图像的粗略示例，请注意，mechanize使用cookie，因此，收到的所有cookie都将随图像请求一起发送到服务器. (这可能是您想要的). br ..

发布时间：2020-05-08 01:03:52 python captcha mechanize Python

如何获得Python的Mechanize来发布ajax请求?

我要搜索的网站正在使用javascript: request.open("POST", url, true); 要获取有关我需要抓取的ajax的其他信息.我尝试了以下各种排列方式: r = mechanize.urlopen("https://site.tld/dir/" + url, urllib.urlencode({'none' : 'none'})) 让Mechaniz ..

发布时间：2020-05-08 01:03:50 python mechanize Python

使用Python进行机械化还有其他选择吗?

我在使用Python 3.6时必须填写表格.不幸的是，mechanize在Python 3上不起作用. 您对机械化有何建议? 解决方案 ..

发布时间：2020-05-08 01:03:47 python mechanize Python

Ruby Mechanize:用户代理?

Mechanize中有多少个用户代理?哪里有方便的所有用户代理选项列表? 解决方案是.查看 https://github.com/sparklemotion/mechanize/blob /master/lib/mechanize.rb#L115 : AGENT_ALIASES = { 'Windows IE 6' => 'Mozilla/4.0 (compatible; MS ..

发布时间：2020-05-08 01:03:45 ruby mechanize 其他开发

我有一个用python编写的机械化脚本，该脚本填写了网络表单，应该单击“创建"按钮.但是有一个问题，该表单有两个按钮.一个用于“添加附件文件"，另一个用于“创建".两者均为“提交"类型，并且“附加"按钮是列出的第一个按钮.因此，当我选择论坛并执行br.submit()时，它单击的是“附加"按钮，而不是“创建"按钮.广泛的Google搜索没有产生任何有用的信息来选择表单中的特定按钮.有人知道跳过第一 ..

发布时间：2020-05-08 01:03:42 python mechanize Python

如何使用Python选择表单中的选项?

我想知道如何以格式设置的方式选择选项 Value1 ..

发布时间：2020-05-08 01:03:40 python mechanize Python

如何测试使用机械化的红宝石应用程序

我编写了一个小程序，该程序使用Mechanize遍历站点. 我想为此编写测试，但不希望它每次运行测试时都实际登录到该站点.我想模拟互联网，以便当它访问某个站点时，它只是返回存储的结果. 这里是一个小例子，假设我的代码的目的是从Google主页上拉出链接，所以我编写了一个测试以确保我的代码找到的第一个链接包含文本"Images".我可能会这样写: require 'rubygems ..

发布时间：2020-05-08 01:03:38 ruby testing mocking mechanize 其他开发

在Python中哪个最好:urllib2，PycURL或机械化?

好，所以我需要使用Python下载一些网页，并对我的选项进行了快速调查. Python随附: urllib -在我看来，我应该改用urllib2. urllib不支持cookie，仅HTTP/FTP/本地文件(不支持SSL) urllib2 -完整的HTTP/FTP客户端，支持cookie等大多数必需的功能不支持所有HTTP动词(仅支持GET和POST，不支持TRACE等) ..

发布时间：2020-05-08 01:03:35 python urllib2 mechanize pycurl Python

nil:NilClass的未定义方法“单击"(机械化)

我正在使用Mechanize构建脚本来从网站抓取数据.该脚本应该单击“阅读传记"链接，然后在下一页上抓取该成员的传记. 这是Rake文件中的脚本: require 'mechanize' require 'date' require 'json' task :testing2 do agent = Mechanize.new page = agent.get("h ..

发布时间：2020-05-08 01:03:33 ruby-on-rails ruby web-scraping mechanize 其他开发

机械化标签br.set_handle_gzip会做什么?

我正在尝试使用python机械化模块以编写一些脚本. 当我运行它时，出现以下错误.set_handle_gzip实际上是什么? manoj@ubuntu:~/pyth$ python rock.py │ ..

发布时间：2020-05-08 01:03:30 python-3.x mechanize mechanize-python 其他开发

使用python机械化提交嵌套表单

我正在尝试在看起来像这样的网页上提交登录表单.我还尝试过提交嵌套表单以及提交这两种表单，每次都出现相同的错误. ..

发布时间：2020-05-08 01:03:23 python mechanize python-2.7 Python

Python机械化JavaScript

我正在尝试使用机械化从此网站上获取纽约北地铁的价格: http://as0.mta.info/mnr/fares/choosestation.cfm 问题在于，当您选择第一个选项时，站点将使用javascript填充可能的目的地列表.我已经用python编写了等效的代码，但似乎无法正常运行.这是我到目前为止的内容: import mechanize import cookielib ..

发布时间：2020-05-08 01:03:20 python mechanize mechanize-python Python

Python，机械化-即使在set_handle_robots和add_headers之后，robots.txt仍不允许该请求

我制作了一个Web爬网程序，它可以获取到页面第一级的所有链接，并从中获取所有链接和文本以及图像链接和alt.这是完整的代码: import urllib import re import time from threading import Thread import MySQLdb import mechanize import readability from bs4 import Be ..

发布时间：2020-05-08 01:03:18 python mechanize robots.txt Python

使用Mechanize查找下一个输入元素?

使用机械化，是否可以在页面的HTML中找到一个短语，例如“电子邮件"，然后找到下一个解决方案 Mechanize在内部使用Nokogiri来处理其DOM解析，这是其在页面中定位不同元素的能力的基础. 可以访问已解析的DOM，并且可以通过它使用Nokogiri定位元素，而Mechanize通常不允许我们查找.例如: requ ..

发布时间：2020-05-08 01:03:15 ruby mechanize 其他开发

302s和使用urllib2丢失cookie

我正在将liburl2与CookieJar/HTTPCookieProcessor结合使用，以尝试模拟登录页面以自动执行上传. 我已经看到了一些问题和答案，但是没有什么能解决我的问题.当我模拟登录最终以302重定向结束时，我丢失了cookie. 302响应是服务器设置cookie的位置，但是urllib2 HTTPCookieProcessor似乎在重定向期间未保存cookie.我尝试创建一 ..

发布时间：2020-05-08 01:03:13 python urllib2 mechanize cookiejar Python

Python urlopen连接异常终止-urlopen错误[Errno 10053]

我有一些代码使用机械化和beautifulsoup来在网络上抓取一些数据.该代码在测试机上工作正常，但是生产机阻止了该连接.我得到的错误是: urlopen error [Errno 10053] An established connection was aborted by the software in your host machine 我已经阅读了类似的帖子，但找不到确切的错误 ..

发布时间：2020-05-08 01:03:08 python proxy mechanize web-scraping errno Python

在机械化中禁用SSL证书验证

我是python的新手，我正尝试使用机械化访问网站. br = mechanize.Browser() r=br.open("https://172.22.2.2/") 这给了我以下错误: Traceback (most recent call last): File "", line 1, in br.open("https:/ ..

发布时间：2020-05-08 01:03:05 python ssl mechanize Python

使用机械化从HTML表中提取数据

首先，这是示例html表: Kangchenjunga 8,586m 28,169ft Nepal/India 1955; G. Band, J. Brown ..

发布时间：2020-05-08 01:03:03 html ruby-on-rails ruby parsing mechanize 前端开发

机械化和NTLM身份验证

以下代码生成401 => Net :: HTTPUnauthorized错误. 从日志中: response-header: x-powered-by => ASP.NET response-header: content-type => text/html response-header: www-authenticate => Negotiate, NTLM respon ..

发布时间：2020-05-08 01:03:00 ruby mechanize ntlm 其他开发

mechanize相关内容