mechanize 第4页 - IT屋-程序员软件开发技术分享社区

机械化Python和addheader方法-如何知道最新的标头?

当前，我正在像这样使用机械化: browser = mechanize.Browser() browser.set_handle_robots(False) browser.set_handle_equiv(False) browser.addheaders = [('User-agent', 'Mozilla/5.0 (X11 ..

发布时间：2020-05-08 01:07:13 python mechanize mechanize-python Python

代理似乎被Mechanize忽略了?

我正在使用http代理和Mechanize模块.我初始化机械对象并按如下所示设置代理: self.br = mechanize.Browser() self.br.set_proxies({"http": proxyAddress}) #proxy address is like 1.1.1.1:8080 然后我像这样打开网站: response = self.br.open( ..

发布时间：2020-05-08 01:07:11 python proxy urllib2 mechanize mechanize-python Python

设置机械化以接受Cookie

我正在尝试使用机械化从网站上检索一些数据，以自动搜索住宅(无垃圾邮件) 但是，当我向网站发送请求时，响应具有以下标头: header: Cache-Control: no-store, no-cache, max-age=0, must-revalidate, private, max- stale=0, post-check=0, pre-check=0 header: C ..

发布时间：2020-05-08 01:07:08 python mechanize Python

Python使用机械化提交帖子数据

我必须提交到服务器的网址如下: www.mysite.com/manager.php?checkbox%5B%5D=5&checkbox%5B%5D=4&checkbox%5B%5D=57&self=19&submit=Go%21 我这样张贴信息: data = {'checkbox%5B%5D': '4', ....and so on... 'self': '19', 'subm ..

发布时间：2020-05-08 01:07:06 python post mechanize urlencode html-post Python

我们正在尝试从Forever 21网站的此页面获取产品网址(from bs4 import BeautifulSoup import urllib import urllib2 import requests #driver = webdriver.Firefox() url = "http://www.forever21.com/Product/Category.aspx?br=f21&cate ..

发布时间：2020-05-08 01:07:02 python beautifulsoup mechanize urllib Python

机械化无法由easy_install安装吗?

我正在从旧的Win2K机器迁移到新的，功能更强大的Vista 64位PC的过程中.大部分迁移都进行得相当顺利-但我确实发现我需要重新安装所有与Python相关的工具. 我已经下载了mechanize-0.1.11.tar.gz文件，并运行easy_install进行安装.这样就产生了C:\ Python25 \ Lib \ site-packages \ mechanize-0.1.11-p ..

发布时间：2020-05-08 01:07:00 python mechanize easy-install Python

太多的连接重置异常错误-在Ruby中机械化

我在Ruby上使用Mechanize，并不断收到此异常错误 C:/Ruby200/lib/ruby/2.0.0/net/protocol.rb:158:in `rescue in rbuf_fill': too many connection resets (due to Net::ReadTimeout - Net::ReadTimeout) after 0 requests on 379 ..

发布时间：2020-05-08 01:06:58 ruby-on-rails ruby mechanize 其他开发

屏幕抓取:自动执行vim脚本

在vim中，我将一系列网页(一次一个)加载到vim缓冲区中(使用vim netrw插件)，然后解析html(使用vim elinks插件).都好.然后，我使用正则表达式编写了一系列vim脚本，最终结果有几千行，其中每一行都已正确格式化(csv)格式以上传到数据库中. 为此，我必须使用vim的标记功能，以便可以遍历文档的特定点，然后将其重新组合成一个csv行.现在，我正在考虑通过使用Perl的 ..

发布时间：2020-05-08 01:06:56 perl vim screen-scraping mechanize 其他开发

机械化如何添加到选择列表?

我刚刚开始尝试通过机械化提交Web表单.在此网页上，有一个要列出的项目列表从MASTER_MODS中选择.可以使用按钮add_MODS在MODS中或使用按钮add_IT_MODS在IT_MODS中进行选择(请参见底部的图).在表单中，它看起来像这样(表单底部的代码): > ..

发布时间：2020-05-08 01:06:54 python mechanize Python

强制机械化使用SSLv3

您将如何强制机械化对需要SSLv3的HTTPS URL使用SSLv3?如果我尝试对所有仅SSLv3的网址使用机械化，则会收到错误消息: URLError: 解决方案一个肮脏的答案.. ..

发布时间：2020-05-08 01:06:52 python ssl mechanize mechanize-python Python

自动检测代理设置Linux

我正在编写一个Python应用程序，该应用程序需要从Internet发送和检索一些信息.我想自动检测代理设置(以避免要求用户设置代理配置).看来 urllib 可以在Windows和Mac OsX上实现，而不能在Unix/Linux上. 我需要/更喜欢使用机械化模块，而不是urllib/urllib2. (更容易处理编码为"multipart/form-data"的数据. 机械化模块可 ..

发布时间：2020-05-08 01:06:50 python proxy mechanize Python

将登录表单与Mechanize一起使用

我知道在Stackoverflow上有与此类似的帖子，但是我仍然无法弄清楚我的尝试出了什么问题. # login to the site mech.get(base_URL) do |page| l = page.form_with(:action => "/site/login/") do |f| username_field = f.field_with(:name => ..

发布时间：2020-05-08 01:06:47 ruby mechanize mechanize-ruby 其他开发

使用机械化并得到未初始化的常量Object :: WWW(NameError)

我在Windows 7 x64 OS中使用机械化，但是得到了未初始化的常量Object :: WWW(NameError)，代码非常简单: require 'rubygems' require 'mechanize' agent = WWW::Mechanize.new 错误发生在行agent = WWW::Mechanize.new 感谢您的帮助！解决方案删除 ..

发布时间：2020-05-08 01:06:43 ruby mechanize 其他开发

Python机械化select_form()-ParseError:SELECT之外的OPTION

我正在使用Python 2.7和Mechanize 2.5.我正在尝试使用select_form()方法，但出现以下错误: File "C:\Python27\lib\site-packages\mechanize\_mechanize.py", line 499, in select_form global_form = self._factory.global_form ..

发布时间：2020-05-08 01:06:41 python mechanize Python

机械化Sinatra冲突

我使用 Mechanize 作为命令行实用程序编写了一个简单的Web搜寻器.然后，我决定使用 Sinatra 创建Web应用程序，但是在尝试运行本地Web服务器时陷入了该错误: /home/nazar/.rvm/gems/ruby-2.0.0-p195/gems/sinatra-1.4.2/lib/sinatra/base.rb:1569:in `run!': undefined metho ..

发布时间：2020-05-08 01:06:39 ruby sinatra mechanize 其他开发

Ruby机械化Zlib :: BufError

不确定为什么我现在使用Mechanize gem会出现此错误-一段时间以来一直在使用它，没有任何问题. 我的脚本将随机停止并引发以下错误: /Users/username/.rvm/gems/ruby-1.9.3-p194/gems/mechanize-2.5.1/lib/mechanize/http/agent.rb:798:in `rescue in response_conten ..

发布时间：2020-05-08 01:06:37 ruby mechanize 其他开发

关于在无响应的网站上等待的机械化我该怎么办?

我注意到，当我使用机械化获取没有响应的网站时，它一直在等待. 我该如何克服这个问题? 解决方案有几种解决方法. Open-Uri和Net :: HTTP具有传递超时值的方法，这些值然后告诉基础网络堆栈您愿意等待多长时间.例如，Mechanize可让您在初始化实例时获得其设置，例如: mech = Mechanize.new { |agent| agent.open_ ..

发布时间：2020-05-08 01:06:35 ruby-on-rails ruby mechanize 其他开发

机械化/OWA用户/密码错误

我正在尝试使用Mechanize从Outlook Web客户端获取电子邮件，但登录时遇到麻烦.它给我列出了以下错误.我已验证用户名和密码正确.有什么想法吗? 这是我的代码: import mechanize b = mechanize.Browser() cj = cookielib.LWPCookieJar() b.set_cookiejar(cj) b.open('https: ..

发布时间：2020-05-08 01:06:33 python mechanize outlook-web-app Python

机械化br.submit()限制?

我的意图是使用Mechanize向网站提交搜索查询，并使用BeautifulSoup分析结果.这将用于同一网站，因此可以对表单名称等进行硬编码.我的初始查询出现问题，如下所示: import mechanize import urllib2 #from bs4 import BeautifulSoup def inspect_page(url): br = mechanize.B ..

发布时间：2020-05-08 01:06:31 python mechanize form-submit Python

如何集成这两个条件块代码以在Ruby中进行挖掘?

如果我的代码没有这些条件，我该如何整合这两个条件?我的代码已经可以正常工作，但是它会刮擦所有行(非粗体和粗体值)，并且不会刮除title属性字符串. 条件1:doc = Nokogiri::HTML(html) doc.xpath('//table[@class="articulos"]/tr[td[5]/p/b]').each do |row| puts row.at_xpath('td[ ..

发布时间：2020-05-08 01:06:28 ruby nokogiri mechanize 其他开发

mechanize相关内容