mechanize 第5页 - IT屋-程序员软件开发技术分享社区

使用Python自动使用JavaScript表单登录网站

我正在尝试编写登录到网站的特定脚本.这个特定的网站包含一个Javascript形式，因此使用“机械化"对我几乎没有运气. 我很好奇，是否还有其他我可能不知道的解决方案会帮助我解决我的情况.如果以前在这里曾问过这个特定问题或一些相关的变体，请原谅，我更喜欢此特定查询的链接.否则，有什么常用的技术/方法来解决此问题? 谢谢. 解决方案我最近一直在使用 PhantomJS 用于此类 ..

发布时间：2020-05-08 01:06:26 javascript python mechanize 前端开发

在python机械化中更改链接

我正在尝试编写一个python脚本，该脚本将生成我的批处理的等级列表.为此，我只需要使用Web浏览器中的inspect元素功能来更改链接的roll-number参数.链接(相对)看起来像: /academic/utility/AcademicRecord.jsp?loginCode=000&loginnumber=000&loginName=name&Home=ascwebsite 我只 ..

发布时间：2020-05-08 01:06:21 python web-scraping mechanize mechanize-python Python

Perl Mechanize:修改页面后获取响应页面吗?

我正在尝试检索一个使用js和数据库加载的页面.加载大约需要2到3分钟.我可以在页面上显示“请等待2到3分钟才能加载页面". 但是页面加载后无法检索. 我已经尝试了以下方法: 1.)使用镜像方法在机械化中.但是响应内容未解码.因此，该文件是乱码. (还尝试编写与镜像方法类似的方法，该方法将解码响应内容，但也无效.未加载新内容.) 2.)尝试添加请求标头'if-modified-si ..

发布时间：2020-05-08 01:06:19 html perl response mechanize if-modified-since 前端开发

Python机械化阻止连接:关闭

我正在尝试使用机械化从网页中获取信息.它基本上可以成功获取第一批信息，但是网页上包含一个用于获取更多信息的“下一步"按钮.我不知道如何以编程方式获取其他信息. 通过使用实时HTTP标头，我可以看到单击浏览器中的下一个按钮时生成的http请求.好像我可以使用机械化发出相同的请求，但是在后一种情况下，我没有进入下一页，而是被重定向到网站的首页. 很明显，机械化所做的事情与我的浏览器有所不同 ..

发布时间：2020-05-08 01:06:16 python mechanize Python

数据抓取多个页面点击循环

试图找到一种方法来使用一种机械来刮擦并将UCAS网站上想要的所有数据添加到数组中.目前，我们正努力在链接点击数中进行机械化编码.想知道是否有人可以提供帮助，在循环中连续单击三个链接，以浏览所有搜索结果页面. 显示大学所有课程的第一个链接在div类morecourses链接之内第二个显示课程名称，持续时间和质量的链接位于div类coursenamearea中第三个链接位于div co ..

发布时间：2020-05-08 01:06:11 ruby-on-rails ruby web-scraping nokogiri mechanize 其他开发

我正在尝试抓取一个网站， https://www.searchiqs.com/nybro/(您必须单击“以访客身份登录"以进入搜索表单.如果我搜索第1方的术语，例如"Andrew"，则结果将具有分页功能，并且请求类型为POST，因此URL不会更改，会话也很快超时.如此之快，以至于如果我等十分钟并刷新搜索网址页面，就会出现超时错误. 我最近开始抓取，因此我大部分时间都在进行GET帖子，以了解U ..

发布时间：2020-05-08 01:06:09 python web-scraping beautifulsoup python-requests mechanize Python

python机械化forms()错误

我正在使用Python 2.7.6和mechanize 0.2.5，并且我想登录到'dining.ut.ac.ir'(我具有用户名和密码)-但是当我尝试运行以下脚本来获取forms list: import mechanize br = mechanize.Browser() br.set_handle_robots(False) br.addheaders = [('User-agent' ..

发布时间：2020-05-08 01:06:07 python mechanize parse-error mechanize-python Python

使用机械化和urllib下载pdf文件

我是Python的新手，我目前的任务是编写一个网络爬虫，该爬虫在某些网页中查找PDF文件并下载.这是我目前的方法(仅适用于1个示例网址): import mechanize import urllib import sys mech = mechanize.Browser() mech.set_handle_robots(False) url = "http://www.xyz.com" ..

发布时间：2020-05-08 01:06:04 python eclipse web-crawler mechanize urllib Java开发

如何从< script>中提取文本使用nokogiri进行标记并机械化?

这是预订网站的源代码的一部分: booking.ensureNamespaceExists('env'); booking.env.b_map_center_latitude = 53.36480155016638; booking.env.b_map_center_longitude = -2.2752803564071655; booking.env.b_hotel_i ..

发布时间：2020-05-08 01:06:02 ruby-on-rails ruby web-scraping nokogiri mechanize 其他开发

使用线程和红宝石机械化安全吗?

有没有人看到过很多这样的错误: Exception `Net::HTTPBadResponse' at /usr/lib/ruby/1.8/net/http.rb:2022 - wrong status line: _SOME HTML CODE HERE_ 何时使用螺纹并机械化?我相对确定这是线程和net/http库之间有一些不良行为，但是确实任何人都对您想要的线程上限有任何建议 ..

发布时间：2020-05-08 01:05:59 ruby multithreading mechanize 其他开发

Python机械化表单提交不起作用

我正在尝试编写一个简单的漫游器，该漫游器将在页面上登录到我的帐户，然后评论其他用户的图像.但是，我无法使评论表单正确提交工作.评论表单如下: ..

发布时间：2020-05-08 01:05:57 python web-scraping mechanize mechanize-python Python

使用Python的Mechanize模块验证br.submit()

只需尝试使用机械化登录网站.当我打印"br.form"时，我可以看到我的凭据输入到我的表单中.但是我不知道如何正确地提交表格. 我使用"br.submit()"，并尝试通过打印br.title()来验证它是否已进入下一页，但是显示的标题是用于登录屏幕的，而不是登录后的屏幕. import mechanize from time import sleep def reportDownlo ..

发布时间：2020-05-08 01:05:55 python-2.7 mechanize mechanize-python 其他开发

Python机械化浏览器:HTTP错误460

我正在尝试使用机械化浏览器登录网站，并收到HTTP 460错误，该错误似乎是人为错误，因此我不确定该怎么做.这是代码: # Browser br = mechanize.Browser() # Cookie Jar cj = cookielib.LWPCookieJar() br.set_cookiejar(cj) # Browser options br.set_handle_equi ..

发布时间：2020-05-08 01:05:53 python screen-scraping mechanize Python

机械化br.click_link()和br.follow_link()之间的差异

我正在使用机械化来自动执行某些表单提交. 要执行此操作，我需要转到某个网站的主页，单击带有特定文本的链接，该链接会将我重定向到另一个页面，然后在新页面中填写表格. 我尝试使用 response = br.follow_link(text_regex="sometext") for f in response.forms() print f.name 我收 ..

发布时间：2020-05-08 01:05:51 python forms mechanize Python

使用FileUtils将WWW :: Mechanize :: File保存到磁盘

使用Ruby进行机械化时，我可以使用agent.get('http://example.com/foo.torrent')，FileUtils或其他方式获得某个文件，如何将该文件保存到硬盘驱动器(例如，在运行脚本的目录中)? P.S. class => WWW::Mechanize::File 解决方案好吧，WWW::Mechanize::File有一个save_as实例方法，所以 ..

发布时间：2020-05-08 01:05:48 ruby mechanize 其他开发

机械化的SSL错误

我在irb 上获得了这些命令 require 'mechanize' agent = Mechanize.new agent.get('https://monabo.lemonde.fr/customer/account/forgotpassword/') 我收到此错误: OpenSSL::SSL::SSLError: SSL_connect returned=1 errno=0 s ..

发布时间：2020-05-08 01:05:46 ruby ssl openssl mechanize 其他开发

Nokogiri错误:未定义方法`radiobutton_with'-为什么?

我尝试使用机械化(Ruby)访问表单. 在我的表格上，我有一小撮单选按钮. 所以我想检查其中之一. 我写道: target_form = (page/:form).find{ |elem| elem['id'] == 'formid'} target_form.radiobutton_with(:name => "radiobuttonname")[2].check 在这一行中，我 ..

发布时间：2020-05-08 01:05:44 ruby nokogiri mechanize 其他开发

机械化开放网址python

我正在尝试使用python中的机械化打开URL.该代码执行没有错误，但实际上没有任何反应.我想念什么?另外，有没有办法设置浏览器?这是python 2.7. import mechanize url='http://www.google.com/' op = mechanize.Browser() # use mecahnize's browser op.set_handle_robots( ..

发布时间：2020-05-08 01:05:41 python python-2.7 mechanize mechanize-python Python

使用Python请求选择表单

我想使用一个能够填写表格并处理重定向的python库: “主页"页面的格式为{'username':'user', 'password':'pass'} “重定向"页面将我带到新页面 “新"页面上有指向最后一页的链接 “最终"页面的格式为{'Field 1':'Data 1', 'Field 2':'Data 2'} 我想进入“最终"页面并填写表格.我已经在SO的每篇文章中查找了 ..

发布时间：2020-05-08 01:05:39 python mechanize python-requests Python

如何使机械化将车身自动转换为UTF8?

我发现了一些使用post_connect_hook和pre_connect_hook的解决方案，但似乎它们不起作用.我正在使用最新的Mechanize版本(2.1).新版本中没有[:response]字段，而且我不知道在新版本中从何处获取它们. https://gist.github.com/search?q=pre_connect_hooks https://gist.github.co ..

发布时间：2020-05-08 01:05:37 ruby utf-8 mechanize 其他开发

mechanize相关内容