mechanize相关内容

使用Python自动使用JavaScript表单登录网站

我正在尝试编写登录到网站的特定脚本.这个特定的网站包含一个Javascript形式,因此使用“机械化"对我几乎没有运气. 我很好奇,是否还有其他我可能不知道的解决方案会帮助我解决我的情况.如果以前在这里曾问过这个特定问题或一些相关的变体,请原谅,我更喜欢此特定查询的链接.否则,有什么常用的技术/方法来解决此问题? 谢谢. 解决方案 我最近一直在使用 PhantomJS 用于此类 ..
发布时间:2020-05-08 01:06:26 前端开发

在python机械化中更改链接

我正在尝试编写一个python脚本,该脚本将生成我的批处理的等级列表.为此,我只需要使用Web浏览器中的inspect元素功能来更改链接的roll-number参数.链接(相对)看起来像: /academic/utility/AcademicRecord.jsp?loginCode=000&loginnumber=000&loginName=name&Home=ascwebsite 我只 ..
发布时间:2020-05-08 01:06:21 Python

Perl Mechanize:修改页面后获取响应页面吗?

我正在尝试检索一个使用js和数据库加载的页面.加载大约需要2到3分钟.我可以在页面上显示“请等待2到3分钟才能加载页面". 但是页面加载后无法检索. 我已经尝试了以下方法: 1.)使用镜像方法在机械化中.但是响应内容未解码.因此,该文件是乱码. (还尝试编写与镜像方法类似的方法,该方法将解码响应内容,但也无效.未加载新内容.) 2.)尝试添加请求标头'if-modified-si ..
发布时间:2020-05-08 01:06:19 前端开发

Python机械化阻止连接:关闭

我正在尝试使用机械化从网页中获取信息.它基本上可以成功获取第一批信息,但是网页上包含一个用于获取更多信息的“下一步"按钮.我不知道如何以编程方式获取其他信息. 通过使用实时HTTP标头,我可以看到单击浏览器中的下一个按钮时生成的http请求.好像我可以使用机械化发出相同的请求,但是在后一种情况下,我没有进入下一页,而是被重定向到网站的首页. 很明显,机械化所做的事情与我的浏览器有所不同 ..
发布时间:2020-05-08 01:06:16 Python

数据抓取多个页面点击循环

试图找到一种方法来使用一种机械来刮擦并将UCAS网站上想要的所有数据添加到数组中.目前,我们正努力在链接点击数中进行机械化编码.想知道是否有人可以提供帮助,在循环中连续单击三个链接,以浏览所有搜索结果页面. 显示大学所有课程的第一个链接在div类morecourses链接之内 第二个显示课程名称,持续时间和质量的链接位于div类coursenamearea中 第三个链接位于div co ..
发布时间:2020-05-08 01:06:11 其他开发

如何使用python抓取aspx页面

我正在尝试抓取一个网站, https://www.searchiqs.com/nybro/(您必须单击“以访客身份登录"以进入搜索表单.如果我搜索第1方的术语,例如"Andrew",则结果将具有分页功能,并且请求类型为POST,因此URL不会更改,会话也很快超时.如此之快,以至于如果我等十分钟并刷新搜索网址页面,就会出现超时错误. 我最近开始抓取,因此我大部分时间都在进行GET帖子,以了解U ..
发布时间:2020-05-08 01:06:09 Python

python机械化forms()错误

我正在使用Python 2.7.6和mechanize 0.2.5,并且我想登录到'dining.ut.ac.ir'(我具有用户名和密码)-但是当我尝试运行以下脚本来获取forms list: import mechanize br = mechanize.Browser() br.set_handle_robots(False) br.addheaders = [('User-agent' ..
发布时间:2020-05-08 01:06:07 Python

使用机械化和urllib下载pdf文件

我是Python的新手,我目前的任务是编写一个网络爬虫,该爬虫在某些网页中查找PDF文件并下载.这是我目前的方法(仅适用于1个示例网址): import mechanize import urllib import sys mech = mechanize.Browser() mech.set_handle_robots(False) url = "http://www.xyz.com" ..
发布时间:2020-05-08 01:06:04 Java开发

使用线程和红宝石机械化安全吗?

有没有人看到过很多这样的错误: Exception `Net::HTTPBadResponse' at /usr/lib/ruby/1.8/net/http.rb:2022 - wrong status line: _SOME HTML CODE HERE_ 何时使用螺纹并机械化?我相对确定这是 线程和net/http库之间有一些不良行为,但是确实 任何人都对您想要的线程上限有任何建议 ..
发布时间:2020-05-08 01:05:59 其他开发

使用Python的Mechanize模块验证br.submit()

只需尝试使用机械化登录网站.当我打印"br.form"时,我可以看到我的凭据输入到我的表单中.但是我不知道如何正确地提交表格. 我使用"br.submit()",并尝试通过打印br.title()来验证它是否已进入下一页,但是显示的标题是用于登录屏幕的,而不是登录后的屏幕. import mechanize from time import sleep def reportDownlo ..
发布时间:2020-05-08 01:05:55 其他开发

Python机械化浏览器:HTTP错误460

我正在尝试使用机械化浏览器登录网站,并收到HTTP 460错误,该错误似乎是人为错误,因此我不确定该怎么做.这是代码: # Browser br = mechanize.Browser() # Cookie Jar cj = cookielib.LWPCookieJar() br.set_cookiejar(cj) # Browser options br.set_handle_equi ..
发布时间:2020-05-08 01:05:53 Python

机械化br.click_link()和br.follow_link()之间的差异

我正在使用机械化来自动执行某些表单提交. 要执行此操作,我需要转到某个网站的主页,单击带有特定文本的链接,该链接会将我重定向到另一个页面,然后在新页面中填写表格. 我尝试使用 response = br.follow_link(text_regex="sometext") for f in response.forms() print f.name 我收 ..
发布时间:2020-05-08 01:05:51 Python

使用FileUtils将WWW :: Mechanize :: File保存到磁盘

使用Ruby进行机械化时,我可以使用agent.get('http://example.com/foo.torrent'),FileUtils或其他方式获得某个文件,如何将该文件保存到硬盘驱动器(例如,在运行脚本的目录中)? P.S. class => WWW::Mechanize::File 解决方案 好吧,WWW::Mechanize::File有一个save_as实例方法,所以 ..
发布时间:2020-05-08 01:05:48 其他开发

机械化的SSL错误

我在irb 上获得了这些命令 require 'mechanize' agent = Mechanize.new agent.get('https://monabo.lemonde.fr/customer/account/forgotpassword/') 我收到此错误: OpenSSL::SSL::SSLError: SSL_connect returned=1 errno=0 s ..
发布时间:2020-05-08 01:05:46 其他开发

机械化开放网址python

我正在尝试使用python中的机械化打开URL.该代码执行没有错误,但实际上没有任何反应.我想念什么?另外,有没有办法设置浏览器?这是python 2.7. import mechanize url='http://www.google.com/' op = mechanize.Browser() # use mecahnize's browser op.set_handle_robots( ..
发布时间:2020-05-08 01:05:41 Python

使用Python请求选择表单

我想使用一个能够填写表格并处理重定向的python库: “主页"页面的格式为{'username':'user', 'password':'pass'} “重定向"页面将我带到新页面 “新"页面上有指向最后一页的链接 “最终"页面的格式为{'Field 1':'Data 1', 'Field 2':'Data 2'} 我想进入“最终"页面并填写表格.我已经在SO的每篇文章中查找了 ..
发布时间:2020-05-08 01:05:39 Python

如何使机械化将车身自动转换为UTF8?

我发现了一些使用post_connect_hook和pre_connect_hook的解决方案,但似乎它们不起作用.我正在使用最新的Mechanize版本(2.1).新版本中没有[:response]字段,而且我不知道在新版本中从何处获取它们. https://gist.github.com/search?q=pre_connect_hooks https://gist.github.co ..
发布时间:2020-05-08 01:05:37 其他开发