mechanize相关内容
我想以编程方式登录 https://www.t-mobile.com/ .我的第一个想法是使用Mechanize提交登录表单: 替代文字http://dl.dropbox.com /u/2792776/screenshots/2010-04-08_1440.png 但是,事实证明,这甚至不是真正的形式.相反,当您单击“登录"时,一些javascript会获取字段的值,动态创建一个新表单
..
我正在登录一个页面,其中他们奇怪地具有一个名为login_email的表单输入和两个名为login_password的表单输入.我需要设置两者的值,但是直接调用form['login_password']会引发错误: File "/Library/Python/2.7/site-packages/mechanize/_form.py", line 3101, in find_contro
..
我需要从网站上抓取数据,但是这需要我先登录.我一直在使用hpricot来成功地抓取其他站点,但是我对使用机械化是陌生的,而且我对如何使用它很困惑. 我看到这个例子通常被引用: require 'rubygems' require 'mechanize' a = Mechanize.new a.get('http://rubyforge.org/') do |page| # Cli
..
我正在尝试使用以下代码登录megaupload.我的问题是,我如何成功登录?我在代码末尾打印了当前URL,但是当我运行脚本时,它只会返回www.megaupload.com. import mechanize import cookielib from BeautifulSoup import BeautifulSoup import html2text # Browser br = me
..
有什么方法可以在Python 3.x中使用Mechanize吗? 或者在Python 3.x中有替代品吗? 我一直在搜索几个小时,但没有找到任何东西:( 我正在寻找使用Python登录该网站的方法,但是该网站使用的是javascript. 预先感谢 亚当. 解决方案 lxml.html提供表单处理工具并支持Python 3.
..
我有这个: class Stress def initialize(user, pass) @user = user @pass = pass @agent = Mechanize.new do |a| a.user_agent_alias = 'Windows Mozilla' a.history.max_size = 0 a
..
我正在构建一个Ruby on Rails应用程序:a)通过LinkedIn通过OAuth对用户进行身份验证,并且我想:b)使用获取的OAuth令牌对Mechanize进行身份验证以访问因此,a)是否可以通过OAuth令牌对Mechanize http访问进行身份验证,b)可以在LinkedIn上使用,c)有人可以指出我的Ruby示例吗? 这是我的宝石: gem 'omniauth',
..
我正在使用以下代码生成一个JSON文件,其中包含特定网站的所有类别信息. require 'mechanize' @hashes = [] @categories_hash = {} @categories_hash['category'] ||= {} @categories_hash['category']['id'] ||= {} @categories_hash['categor
..
我想从使用JSON数据来设置自定义搜索参数的网站检索数据,这似乎是通过AJAX请求的.传输的数据显示在Firebug中的XHR-> Request Payload下: {"filters": [{"action": "post", "filterName": "Hersteller", "ids": [269], "settingName": "Hersteller", "settingV
..
我想从 https://admin.booking.com/hotel/hoteladmin获取JavaScript变量在 head>中脚本> var token 。 我不知道浏览器如何设置此变量,因为当我从Mechanize获取此页面时,我得到: var token =''|| 'empty-token', 以下是我用来获取此页面的代码: login_ur
..
是否可以让机械化遵循javascript类型的锚链接? 我正在尝试使用mechanize和beautifulsoup登录python中的网站。 这是锚链接
..
所以我对网络抓取相当新。这个站点上有一个表,表的值由Javascript控制。这些值将确定我的浏览器被告知从Javascript请求的未来值的地址。这些新页面有JSON响应,脚本在我的浏览器中更新表。 所以我想用一个机制化方法构建一个类,该方法接收一个url和spits出于身体反应,第一次是HTML,之后,身体反应将是JSON,用于剩余的迭代。 我有一些有效的但我想知道是否我做得对,或
..
我正在使用模块'mechanize'在python中编写一个屏幕抓取器脚本,我想在href中使用javascript:__ doPostBack的链接上使用mechanize.click_link()方法。 我相信我试图解析的页面是使用AJAX。 注意:mech是mechanize.Browser() >>> next_link .__ class __.__ name__ 'Li
..
我正在使用python的机械化模块导航网站,并且无法点击下一页的javascript链接。我做了一些阅读,人们建议我需要python-spidermonkey和DOMforms。我设法安装它们我不确定实际点击链接的语法。 我可以在页面上识别代码:
..
我想知道是否有类似Perl的/ Python的Java机制化。 谢谢! 解决方案 查看 HtmlUnit 。它类似于Perl的 WWW :: Mechanize 。它的Perl版本名为 WWW :: HtmlUnit (它使用 Inline :: Java 来公开Java库的方法到Perl)。
..
我一直在使用Perl的Mechanize库但出于某些原因使用https超时参数(我正在使用Crypt :: SSLeay用于SSL)。 my $ browser = WWW :: Mechanize-> new(autocheck => 0,timeout => 3); 有没有人遇到过这个并且知道如何修复它?谢谢! 解决方案 对于HTPS / SSL,你必须做一些解决方法:
..
我有以下代码: 导入请求 导入sys import urllib2 import re import mechanize import cookielib #import json #import imp #print(imp.find_module(“requests”)) # print(requests .__ file__) EMAIL =“******
..
我们有一个使用 WWW的Perl脚本: :机械化使用WWW :: Mechanize中的POST操作通过我们的公司代理从安全(https)网站下载内容。 有时这个帖子动作会因为未知原因而持续数小时。 我想控制它。我检查了超时,但我也在Stackoverflow中的一篇文章中读到它与https网站不兼容。 我知道如何使用超时机制吗? 我想停止处理该链接,说一分钟左右后继续进行
..
我有一个网页,其中包含通过HTTP加载的登录表单,但它通过HTTPS提交数据。 我正在使用python-mechanize登录此站点,但似乎数据是通过HTTP提交的。 我的代码如下所示: import mechanize b = mechanize.Browser() b.open('http://site.com') form = b.forms()。next()#登录
..
我使用Python 2.7.2和Mechanize 0.2.5。 当我访问Internet时,我必须通过代理服务器。我写了下面的代码,但在最后一行发生了URLError ..有没有人对此有任何解决方案? import mechanize br = mechanize.Browser() br.set_debug_http(True) br.set_handle_robot
..