mechanize相关内容

在两个单独的页面上抓取需要登录用户名和密码的站点

我正在尝试从我的公司 Intranet 中抓取信息,以便我可以通过仪表板在我们的办公室墙板上显示信息.我正在尝试使用以下提供的信息:此站点.除了菜鸟之外,我遇到的问题是,为了访问我想要抓取的信息,我需要登录到我们的 Intranet,在一个页面上提供我的用户名,然后提交到另一个,以便我可以提供我的密码.登录后,我可以链接和抓取我的数据. 这是我的登录用户名页面的一些源代码: 这是我的 ..
发布时间:2022-01-18 22:27:34 其他开发

Ruby SSL 错误 - sslv3 警报意外消息

我正在尝试使用 ruby​​ 脚本连接到服务器 https://www.xpiron.com/schedule.但是,当我尝试连接时: 需要'open-uri'doc = open('https://www.xpiron.com/schedule') 我收到以下错误消息: OpenSSL::SSL::SSLError: SSL_connect Returned=1 errno=0 state ..
发布时间:2022-01-07 19:12:18 其他开发

Python 机械化登录网站

我正在尝试使用 Python 和 Mechanize 登录网站,但是,在尝试让 POST 数据按我想要的方式运行时遇到了麻烦. 基本上我想使用机械化和 Python 来复制这个: wget --quiet --save-cookies cookiejar --keep-session-cookies --post-data "action=login&login_nick=USERNAME ..
发布时间:2022-01-06 10:03:49 Python

通过 POST 请求发送二进制图像

我正在尝试发布请求以将 img 上传到 https://pasteboard.co/,但我总是收到 500 响应,告诉我,有一个丢失的文件. 文件确实存在,路径正确,不知道问题出在哪里. 进口机械汤浏览器 = Mechanicalsoup.StatefulBrowser()browser.set_user_agent('Mozilla/5.0 (Macintosh; Intel Mac O ..
发布时间:2021-12-31 20:23:29 Python

使用 Watir 将多个文件传递到输入节点(使用 Ruby)

所以我遇到了一些障碍.我正在尝试自动化一个测试用例,我需要将多个文件传递给一个输入节点,但我不知道该怎么做.我可以使用 Mechanize 或 Watir,但在自动化方面似乎相对重要的主题上几乎没有找到相关信息.在下面的片段中,我将 Watir 与 Ruby 结合使用.The main issue I'm having is that it seems when multiple files ar ..
发布时间:2021-12-29 13:33:54 其他开发

以机械化形式选择未命名的文本字段(python)

所以我正在制作一个程序,使用机械化和python将街道地址批量转换为gps坐标.这是我第一次使用机械化.我可以在页面上选择表单(“form2").但是表单中的文本框没有名称.我如何选择文本框以便机械化可以输入我的文本?我试过通过它的 id 选择它.但是这是行不通的. br.select_form("Form2") #据我所知有效br.form["search"] = ["1lakewood dr ..
发布时间:2021-12-29 13:26:56 Python

是否有相当于 Perl 的 WWW::Mechanize 的 PHP?

我正在寻找一个功能类似于 Perl 的WWW::Mechanize,但适用于 PHP.基本上,它应该允许我使用简单的语法提交 HTTP GET 和 POST 请求,然后解析结果页面并以简单格式返回所有表单及其字段以及页面上的所有链接. 我知道 CURL,但它有点过于准系统,而且语法非常难看(大量的 curl_foo($curl_handle, ...) 语句 说明: 我想要比目前 ..
发布时间:2021-12-29 12:45:39 PHP

如何使用 Nokogiri 解析 HTML 表格?

我安装了 Ruby 和 Mechanize.在我看来,Nokogiri 可以做我想做的事,但我不知道该怎么做. 这个table怎么样?它只是 vBulletin 论坛站点 HTML 的一部分.我试图保留 HTML 结构,但删除了一些文本和标签属性.我想获取每个线程的一些详细信息,例如:标题、作者、日期、时间、回复和查看次数. 请注意,HTML 文档中的表格很少?我正在寻找一个带有 tb ..
发布时间:2021-12-28 10:59:41 前端开发

带有 JavaScript 的编程 Python 浏览器

我想对使用 JavaScript 的网站进行屏幕抓取. 有 mechanize,这是 Python 的编程网络浏览器.但是,它(可以理解)不会解释 javascript.是否有任何适用于 Python 的程序化浏览器?如果没有,我可以使用 Python 中的任何 JavaScript 实现来尝试创建一个吗? 解决方案 你最好使用像 Selenium 使用 Web 浏览器自动抓取,以便 ..
发布时间:2021-12-25 11:56:44 前端开发

机械化和 Javascript

我想使用 Mechanize 来模拟浏览到带有活动 JavaScript 的网页,包括 DOM 事件和 AJAX,但到目前为止我还没有找到方法. 我查看了一些支持 JavaScript 的 Python 客户端浏览器,如 Spynner 和 Zope,但没有一个真正适合我.Spynner 总是让 PyQt 崩溃,而 Zope 似乎并不支持 JavaScript. 有没有一种方法可以模拟 ..
发布时间:2021-12-25 11:38:18 前端开发

屏幕抓取:绕过“HTTP 错误 403:robots.txt 不允许请求";

有没有办法解决以下问题? httperror_seek_wrapper:HTTP 错误 403:robots.txt 不允许请求 这是联系网站所有者 (barnesandnoble.com) 的唯一途径.我正在建立一个可以为他们带来更多销售额的网站,但不知道为什么他们会拒绝一定深度的访问. 我在 Python2.6 上使用 mechanize 和 BeautifulSoup. 希望 ..

使用python mechanize的复选框输入

我想使用 python mechanize 填写表格.表格看起来像: 如何将 live 或 undefinesource(复选框)的值设置为 True(勾选)或 False(取消勾选)live 和 undefinsource 的项目是: >>>打印 br.form.controls[4].get_items()[ ..
发布时间:2021-12-23 08:43:18 Python

使用 Python 和 Mechanize 提交表单数据并进行身份验证

我想提交网站 Reddit.com 的登录信息,导航到页面的特定区域,然后提交评论.我看不出这段代码有什么问题,但它不起作用,因为 Reddit 网站上没有反映任何更改. 导入机械化导入cookielib定义主():#浏览器br = mechanize.Browser()# 饼干罐cj = cookielib.LWPCookieJar()br.set_cookiejar(cj)# 浏览器选项br ..
发布时间:2021-12-20 10:08:08 Python

机械化蟒蛇点击一个按钮

我有一个带有 按钮的表单,希望能够点击它. 我试过 mech.form.click("submit") 但出现以下错误: ControlNotFoundError: 没有控件匹配类型 'clickable', id 'submit' mech.submit() 也不起作用,因为它的类型是按钮而不是提交. ..
发布时间:2021-12-18 20:04:48 Python

如何处理 IncompleteRead:在 python 中

我正在尝试从网站获取一些数据.但是它返回我未完成阅读.我试图获取的数据是一组巨大的嵌套链接.我在网上做了一些研究,发现这可能是由于服务器错误(A chunked transfer encoding finish before达到预期大小).我还在此链接上找到了上述解决方法 但是,我不确定如何在我的情况下使用它.以下是我正在处理的代码 br = mechanize.Browser()br.a ..
发布时间:2021-12-17 13:32:54 Python