puppeteer相关内容
我正在尝试在 Puppeteer 的评估函数中使用 XPath 和外部变量,但是有一个问题: 如果我使用评估函数并传入外部变量,则无法传入 XPath, 如果我删除 XPath 一切正常,但我需要使用 XPath 来完成. 我刚刚收到此错误: UnhandledPromiseRejectionWarning: TypeError: 转换循环JSON 的结构-->从构造函数“Br
..
我们的网站有很多流程(登录、注册、支付等) 我们正在使用 puppeteer 脚本(通过节点打字稿)来自动测试我们的网站行为(全流程),当我们收到错误(或意外结果)时,我们会发送电子邮件或某种警报. > 但我看到人们也将 jasmine 与 puppeteer 一起使用. 例如: const puppeteer = require('puppeteer');描述(“茉莉花木偶",
..
我正在创建一个 Web api,用于抓取给定的 url 并将其发回.我正在使用 Puppeteer 来做到这一点.我问了这个问题:Puppeteer 不像在开发者控制台中那样> 并收到了一个答案,表明它只有在 headless 设置为 false 时才有效.我不想经常打开我不需要的浏览器 UI(我只需要数据!)所以我在寻找为什么 headless 必须是 false,我能得到一个让 headle
..
我正在尝试抓取一页网站.有多种选择组合会导致不同的搜索重定向.我在 page.evaluate 的回调函数中写了一个 for 循环来点击不同的选择并在每个按钮中进行点击搜索.但是,我收到错误:将循环结构转换为 JSON 您是否正在传递嵌套的 JSHandle? 请帮忙! 我当前的代码版本如下: const res = await page.evaluate(async (i, cou
..
你好,我是木偶操作新手,现在有一个星期了我只想在 Google 上搜索“Intel"这个词后点击搜索结果: 我的源代码: const puppeteer = require('puppeteer');异步函数搜索(){const browser = await puppeteer.launch({executablePath: 'C:\\Program Files (x86)\\Googl
..
我在测试上下文中对 shadowroot 中的元素执行操作时遇到困难.假设我有一个 web 组件 并且它包含一个按钮
..
我正在使用 puppeteer 从标记和下载图像由浏览器发送到 Express 应用程序的 css.Express 编译模板,只需将 POSTed 标记插入 html shell &在本地获取 css(安装在 docker 卷上). 当我呈现 html &css直接在chrome中,所有文本和其他元素都按预期显示.但是,保存的屏幕截图缺少文本. 当我忽略我们的样式时,文本在本地 chr
..
使用 Puppeteer 从 Node 中监听 map.on('load'). (async() => {const browser = await puppeteer.launch({ headless: false, devtools: true });const page = await browser.newPage();功能节点日志(味精){控制台日志(味精);}page.on('lo
..
所以一个 git 问题让我回滚了大约两周的工作 - 我目前正在尝试将大约 3300 个字符串的数组传递给把手模板,然后尝试将其打印为 pdf - 我的问题是我很确定我的 pupepteer URL 被截断为 3000 个字符.我不知道如何解决. 数组(3330)[对象,对象,对象,对象,对象,对象,对象,对象,...]>>>var templateHtml = fs.readFileSy
..
我很高兴使用 R 进行抓取,但发现了它的局限性.试图刮阿根廷最高法院的案件摘要,我发现了一个我无法找到答案的问题.这很可能是边做边学的结果---所以请做指出我的代码在哪里工作但遵循了一个相当糟糕的做法.无论如何,我设法: 访问搜索页面. 在 #voces 中输入相关分类术语(例如“DECRETO DE NECESIDAD Y URGENCIA"),点击搜索并刮取.datosSumarios
..
我正在尝试从这两个部分获取文本并将其转换为来自 puppeteer 的 CSV 列表: 商品编号:(商品 1055688) 价格:(16.59 美元) 这是我尝试过的,但似乎无法找到 SKU,例如: let elements = await.self.page.$$('div[class="row item-row"]');for(让元素的元素){let sku = await
..
所以我正在开发这个 puppeteer 应用程序,它要求我获取 Facebook 群组帖子中的帖子链接,尤其是帖子的链接,即帖子下方帖子的时间和日期作者姓名.而且我只想为第一篇文章获取该帖子链接. 所以要做到这一点,我必须首先选择作为父级的帖子的最外面的 div.很明显,提要中的每个帖子都包含与这张照片中显示的相同的类: 上图显示了 Facebook 提要的典型 html 结构.第一个
..
我正在尝试将一个值传递给 puppeteer 创建的浏览器,但出现此错误: 无法读取未定义的属性“getElementById" 异步函数 start() {const browser = await puppeteer.launch({无头:假});const page = await browser.newPage();await page.goto('https://www.goog
..
我是新来的,所以你可以帮助我!? 我需要使用 puppetter 在虚拟引用 #document html 中获取一些元素,但是当我尝试时,我收到一条消息,该元素不存在. 以下示例: HTML
..
我用 puppeteer 制作了一个刮刀,但我没有指定任何端口来提供它.它只是运行并抓取数据并使用 process.exit() 命令退出. 我使用 cli 将它部署到 heroku,但运行后抛出错误: Error R10(启动超时)->Web 进程未能在启动后 60 秒内绑定到 $PORT.使用 SIGKILL 停止进程进程以状态 137 退出 怎么了? 解决方案 看起来您有一
..
我有这个理论上应该可以工作的代码,但它没有. 我想它缺少一些东西: function containsWords(words, word) {返回 words.filter(w => w === word).length >0;}异步函数grabResult(页面){const message = await page.$eval('div>div:nth-child(2)',(el) =
..
我正在尝试在一个建立在 apache Struts 框架上的已有 20 年历史的电子商务网站上实现 puppeteer 自动化.我无法复制整个 struts 操作 servlet,但是我模拟了 HTML 页面,一旦人们登录并选择商店,这些页面就会在框架中加载 14 个不同的页面.目标是从第 5 个深度子框架页面中加载的 14 个页面之一中单击 Create New Shopping Basket.
..
正在尝试测试页面 https://publicindex.sccourts.org/anderson/publicindex/使用标准浏览器导航到页面时,导航会在请求的页面结束 (https://publicindex.html).sccourts.org/anderson/publicindex/),页面显示“接受";按钮. 但是,在无头模式下使用 puppeteer 进行测试时,请求被重
..
我是 puppeteer 新手,正在学习抓取网页.网页的结构是这样的: 我想要做的是抓取 之间的所有 标签.状态
和
Naam
.使用我当前的代码,我可以抓取此页面上的所有
标签.直到现在我才尝试在 之后抓取所有 标签.状态 直到 Naam . 我当前的代码: const puppeteer = require('puppeteer'
..
我正在尝试获取此页面的完整 html.它有一个加载缓慢的电子表格.我可以在截取页面截图时包含电子表格.但是我无法获得电子表格的 html.document.body.outerHTML 不包括电子表格的 html.就好像 puppeteer 在电子表格加载之前仍在查看页面一样. 如何获取包含电子表格 HTML 在内的完全加载的 HTML? (异步() => {const browser =
..