mechanize-ruby相关内容
假设在网页中我具有以下值: test11 test12
..
我可以使用Faraday(Faraday.head网址)执行HEAD请求,但是我正在当前项目中使用Mechanize. 我想从标题(文件名)中获取一个值而不下载文件.机械化宝石是否提供了这样的选择?我正在使用v2.0. 解决方案 就像get一样,但它是head: page = agent.head 'http://www.google.com/' page.body.lengt
..
在Ruby上的Mechanize中,我必须为进入的每个新页面分配一个新变量.例如: page2 = page1.link_with(:text => "Continue").click page3 = page2.link_with(:text => "About").click ...etc 有没有一种方法可以在没有变量保存每个页面状态的情况下运行Mechanize?喜欢
..
我正在尝试进行一些爬网,但是WWW:Mechanize gem似乎不喜欢编码和崩溃. 发布请求会导致302重定向(随后会进行机械化,到目前为止效果很好),结果页面似乎将其崩溃. 我用谷歌搜索了很多,但是到目前为止,如何解决这个问题都没有.你们有个主意吗? 代码: require 'rubygems' require 'mechanize' agent = WWW::Mechaniz
..
我正尝试在属于我的客户的网站上抓取这些职位清单,并为这些职位清单提供更多的曝光机会.问题是我需要能够链接到特定的工作清单,以便求职者申请. 这是页面,我正尝试保存列表链接. 如果我可以保存一个地址供求职者单击以查看原始列表然后申请,那将是理想的. 该网站在不显示这些页面的URL的情况下做什么 是否可以提供商家信息特定的地址 如果可能的话,我该如何生成该地址? 如果我找不到特定
..
我有这个: Account Summary 我想单击该链接,但是使用link_to时出现错误. 我尝试过: bot.click(page.link_with(:href => /menu_home/)) bot.click(page.li
..
我无法使Mechanize加载以前可以正常工作的页面-可靠地失败,并显示Errno: ECONNRESET: Connection reset by peer - SSL_connect消息.关于我应该尝试什么或应该关注的细节有什么建议吗? (请参阅下面的“我尝试过的方法" ...) 更新1 从相关的S.O中获得提示.帖子,我尝试使用Net::HTTP直接访问该网站.设置http.ss
..
我有一个网页,其网页格式与html相似,如下所示:
.... . . . alo foo bla
..
我正在开发一个可从 http://www.screener.in/获取HTML的应用程序 我可以输入"Atul Auto Ltd"之类的公司名称并提交,然后从 我正在使用以下代码: require 'mechanize' require 'rubygems' require 'nokogiri' Company_name='Atul Auto Ltd.' agent = Mecha
..
我知道在Stackoverflow上有与此类似的帖子,但是我仍然无法弄清楚我的尝试出了什么问题. # login to the site mech.get(base_URL) do |page| l = page.form_with(:action => "/site/login/") do |f| username_field = f.field_with(:name =>
..
我需要调整Mechanize实例与API的连接频率(每2秒一次,因此将连接限制为一个或更多) 所以这个: instance.pre_connect_hooks
..
我无法从字符串中删除空格. 我的HTML是:
Cena pro Vás: 139 Kč
我的代码是: #encoding: utf-8 require 'rubygems' require 'mechanize' agent = Mechaniz
..
我编写了一个脚本,该脚本将遍历数据库中的所有客户,验证其网站URL是否有效,并尝试在其主页上找到一个Twitter链接.我们有超过10,000个网址可供验证.在验证了一部分网址之后,我们开始为每个网址获取getaddrinfo错误. 以下是刮取单个URL的代码的副本: def scrape_url(url) url_found = false twitter_name =
..
错误:错误:安装时出现错误机械化: 错误:无法构建gem本机扩展。 $ b $ / usr / local / bin / ruby extconf.rb install mechanize 检查#include ...是 检查#include ...是 检查#包括 ...是 检查#include ...是 在-lxml2中检查xm
..
使用以下代码(来自Mechanize站点,但是在耙子任务中).. 命名空间:ans do task:grab => :environment do a = Mechanize.new {| agent | agent.user_agent_alias ='Mac Safari' } begin a.get('http://google.com/')do | page
..