phantomjs相关内容
我有一个包含大量 AJAX 的主干应用程序.(每个页面加载导致 5-6 次 ajax 调用)因为我在这些视图中有很多视图和内部视图, 如果我运行 Phantom.js,我能得到最终的 html 结果吗? 最终结果是用户在我的所有 ajax 调用运行后看到的. 解决方案 PhamtonJs 是一个带有 JavaScript API 的无头 WebKit.在抓取页面时,Phatom
..
我使用以下基于 loadspeed.js 示例的代码打开一个 https://站点,该站点也需要 http 服务器身份验证. var page = require('webpage').create(), system = require('system'), t, address;page.settings.userName = '我的用户名';page.settings.password =
..
我在通过 cmd 运行的 js 文件中使用 PhantomJs、CasperJs 和 Js. 假设我们有两个文件(test1.js 和 test2.js).这两个文件都有一个 url/site 变量,用于将测试定向到特定地址.每次环境改变或目标位置改变时,我们都需要更新这个变量. 为了避免更新文件,我想通过命令行传递值,以了解在哪里测试. 有没有办法在运行文件时通过 cmd 声明
..
Phantom.js 文档展示了如何监控 HTTP 通信:http://phantomjs.org/network-monitoring.html 但是,它不适用于 WebSockets.如何在 Phantom.js 中监控 WebSocket 通信? 解决方案 PhantomJS 1.x 不支持 WebSockets1,因此您无法监控它们.如果页面使用 WebSockets 的一些
..
可以使用 PhantomJS 替代 美汤? 我正在尝试在 Etsy 上搜索并访问术语中的所有链接.在 Python 中,我知道如何做到这一点(使用 BeautifulSoup),但今天我想看看我是否可以使用 PhantomJS 做到这一点.我不会走得很远. 此脚本应在 Etsy 上搜索“hello kitty"并返回所有产品
..
我是 Python 新手,但需要修改其他人创建的代码.我无法发布完整的代码,但我在下面发布了大部分代码: from bs4 import BeautifulSoup导入日期时间导入获取通行证从 Gmail 导入 Gmail从硒导入网络驱动程序从 selenium.common.exceptions 导入 NoSuchElementException从 selenium.common.except
..
我目前正在努力将 Phantom.js 与我的 Meteor 应用程序一起使用.我将它安装在我的本地机器 (Ubuntu 14.04) 上,它被添加到我的路径中(我可以从我的终端运行它),我还运行并安装了 Phantomjs 的智能包装器:mrt add phantomjs. 我可以在我的 .meteor > 中看到这一点本地 >构建 >程序 >服务器 >npm 目录下有一个 phantom
..
下面的代码希望 Phantom.js 加载页面,点击按钮并等待 5 秒钟,然后返回页面的 HTML 代码. 问题:但是使用 setTimeout() 来创建 5 秒延迟会导致page.evaluate 函数将 null 返回给回调函数而不是 HTML. myUrl = 'http://www.google.com'var phantom = Meteor.npmRequire('phant
..
我正在使用 PhantomJS v1.4.1 来加载一些网页.我无权访问他们的服务器端,我只是获得指向他们的链接.我使用的是过时版本的 Phantom,因为我需要在该网页上支持 Adobe Flash. 问题是许多网站都在异步加载它们的次要内容,这就是为什么 Phantom 的 onLoadFinished 回调(类似于 HTML 中的 onLoad)在并非所有内容都已加载时过早触发的原
..
似乎新的 Gmail 图像代理不适用于 SVG(如果您在新选项卡中打开代理网址,则会出现 404 错误.) 我找不到任何有关支持/阻止的文件类型的文档.gmail 中的 SVG 对其他人有用吗? 我能想到的唯一解决方法是使用 PhantomJS 在服务器上生成 svg 的 png - 还有其他选项吗? 背景: 这是一个发送每日摘要电子邮件的 web 应用程序,显示了过去 2
..
我正在学习 PhantomJS 进行抓取.我开始整合 CasperJS.当我运行 CasperJS 和文件名时,我会返回 CasperJS 需要 PhantomJS v1.x 如何更改 PhantomJS 版本以使用 CasperJS?有没有更简单的方法来抓取大量 javascript 的网站? 我使用了cheerio和require,但他们只得到静态html. 解决方案 如果您
..
您可能已经在这里看到了过去几周我绝望的沮丧.我一直在抓取一些等待时间数据,但仍然无法从这两个站点获取数据 http://www.centura.org/erwait http://hcavirginia.com/home/ 起初我为 Python 尝试了 BS4.以下是 HCA Virgina 的示例代码 from BeautifulSoup import BeautifulS
..
我试图通过阻止下载 CSS/其他资源来加速 Python 中的 Selenium/PhantomJS 网络爬虫.我只需要下载 img src 和 alt 标签.我找到了这个代码: page.onResourceRequested = function(requestData, request) {if ((/http:\/\/.+?\.css/gi).test(requestData['url'
..
我使用 Phantomjs 抓取使用 JavaScript 和 Ajax 加载动态内容的网站. 我有以下代码: var page = require('webpage').create();page.onError = 函数(味精,跟踪){var msgStack = ['错误:' + msg];if (trace && trace.length) {msgStack.push('跟踪:')
..
我正在寻找一个请求网页的示例,等待 JavaScript 呈现(JavaScript 修改 DOM),然后抓取页面的 HTML. 这应该是一个带有明显 PhantomJS 用例的简单示例.我找不到一个像样的例子,文档似乎都是关于命令行使用的. 解决方案 根据你的评论,我猜你有 2 个选择 尝试找一个phantomjs节点模块——https://github.com/amir20
..
CasperJS 正在被 PHP 使用 exec() 命令调用.CasperJS 完成检索网页部分等工作后,如何将检索到的数据返回给 PHP? 解决方案 您可以将输出从 stdout 重定向到数组. 在这个页面上,它说你可以: string exec ( string $command [, array &$output [, int &$return_var ]] ) 接着说:
..
我试图从一个页面中抓取链接,当用户向下滚动到底部(无限滚动)时,该页面会动态生成内容.我尝试用 Phantomjs 做不同的事情,但无法收集第一页以外的链接.假设加载内容的底部元素具有类 .has-more-items.它在滚动时加载最终内容之前可用,然后在 DOM 中变得不可用(显示:无).这是我尝试过的东西- 在 var page = require('webpage').create(
..
我想从我的 php 脚本运行一个 phantomjs 服务器,然后向它发出 curl 请求并读取它的响应(在最终版本中将给出生成的 pdf 的路径).从控制台运行 phantomjs 服务器文件,然后在浏览器中导航到它的地址时,一切正常.那是 server.js 文件: var server, service, page = require('webpage').create(), addres
..
我想部署一个带有运行 Procfile 的应用 web:节点 myapp.js 其中 myapp.js 使用 phantomjs-node 运行无头 webkit 内容,将结果返回给浏览器请求.这可能吗? 解决方案 Heroku Toolbelt 现在有一流的支持多个构建包,因此您可以通过以下方式获得有效的 Node 和 PhantomJS 设置: heroku buildpac
..
是否可以安装一个节点模块,通过 npm 安装,然后从 casperjs 脚本require它? (我看到很多帖子和工具可以从 node.js 内部运行 casper 或 phantom,但这不是我想要做的.) casperjs 文档似乎说这是可能的,但只显示手写的玩具模块并没有真正做任何事情.我尝试安装的实际模块是 imap,但此时我无法让任何模块工作,即使是像 net 这样的内置模块
..