mechanize相关内容

不能使用Perl WWW :: Mechanize勾选复选框

我正在使用Perl WWW :: Mechanize制作一个webscraper.我的问题是,我要抓取的网站使用的JavaScript太多了.我正在使用凭据登录,然后使用$mech->follow_link(url)遍历到自定义搜索. 问题从这里开始.我登陆到一个页面,我必须从一个启用了JavaScript的下拉列表中选择一个复选框和一个单选按钮.我被困在这一点上. html的部分如下 ..
发布时间:2020-05-08 01:08:00 前端开发

如何使用Mechanize登录和爬网站点

我正在尝试使用Mechanize登录和抓取网站. 由于某种原因,我似乎无法使登录功能正常工作.有什么想法吗? 这是我的代码: require 'nokogiri' require 'open-uri' require 'mechanize' a = Mechanize.new a.get('https://jackthreads.com/') form = a.page.fo ..
发布时间:2020-05-08 01:07:52 其他开发

Python urllib2解析html问题

我正在使用机械化方法来解析网站的html,但是使用此网站,我得到了奇怪的结果. from mechanize import Browser br = Browser() r = br.open("http://www.heavenplaza.com") result = r.read() 结果是我无法理解的东西.您可以在此处看到: http://paste2.org/p/1556077 ..
发布时间:2020-05-08 01:07:45 Python

python,机械化-使用机械化打开文本文件

我正在学习机械师.我正在尝试打开一个文本文件,您将单击的链接显示为 文字(.prn) 我遇到的一个问题是此页面上只有1个表单,并且文件不在表单中. 对我来说,另一个问题是此页面上有几个文本文件,但是它们的名称相同 文字(.prn).所以我想我需要去第一个并且打开它.使我尝试打开的文本文件唯一的一件事是,它似乎被命名为 Summary,也许我可以使用它来打开它,然后 然后使用br.form.fin ..
发布时间:2020-05-08 01:07:35 Python

无法从文本文件中打印特定行

所以我目前有这段代码可以读取一个如下所示的account.txt文件: username1:password1 username2:password2 username3:password3 然后让我(感谢这里的一名成员)读取accounts.txt文件,并将其拆分为用户名和密码,以便以后进行打印.当我尝试使用用户名和密码分别用以下代码打印第1行时: with open('acco ..
发布时间:2020-05-08 01:07:27 Python

使页面机械化超出请求边界

我正在编写一个ruby应用程序,该应用程序可以代表用户向远程博客发布评论.我的问题是,我必须在控制器的post方法中使用相同的页面,才能保持会话的活动状态&填写验证码: app/controller/comment_controller.rb require 'mechanize' class CommentController ..
发布时间:2020-05-08 01:07:24 其他开发

Perl WWW :: Mechanize-身份验证错误获取URL

我正在尝试使用Perl的Mechanize库填写Web表单. 每当我在搜索框中输入URL时,都会提示以下消息,并且我可以成功手动登录. 但是,当我运行以下脚本时,出现以下错误: 如何使用我的$mech对象正确填写第一个身份验证盒凭据? my $mech = WWW::Mechanize->new( 'keepalive' => 1 ); my $url = "http:/ ..
发布时间:2020-05-08 01:07:21 其他开发

Python Mechanize检查服务器是否可用

我正在尝试编写一个脚本,该脚本将读取包含一些url的文件,然后使用机械化模块打开浏览器实例.我只是想知道如果不存在某些URL或服务器无法访问该怎么办. 例如 import mechanize br = mechanize.Browser() b = br.open('http://192.168.1.30/index.php') 我想知道的是,如果192.168.1.3 ..
发布时间:2020-05-08 01:07:15 Python