goutte相关内容

如何从需要 cookie 登录的网站中抓取 PHP 中的网站内容?

我的问题是它不仅需要基本的 cookie,还需要会话 cookie 和随机生成的 ID.我认为这意味着我需要使用带有 cookie jar 的网络浏览器模拟器? 我曾尝试使用 Snoopy、Goutte 和其他几个网络浏览器模拟器,但到目前为止我还没有找到有关如何接收 cookie 的教程.我有点绝望了! 谁能举个例子告诉我如何在 Snoopy 或 Goutte 中接受 cookie? ..
发布时间:2021-12-17 13:21:43 PHP

在 Goutte 中设置代理

我尝试使用 Guzzle 的文档来设置代理,但它不起作用.Goutte 的官方 Github 页面已经死了,所以在那里找不到任何东西. 有人知道怎么设置代理吗? 这是我试过的: $client = new Client();$client->setHeader('User-Agent', $user_agent);$crawler = $client->request('GET', ..
发布时间:2021-09-24 18:43:43 PHP

如何使用Goutte获取元描述内容

能帮我找到一种使用Goutte从元描述,元关键字和机器人内容中获取内容的方法吗?另外,如何定位和? 下面是我用来获取内容的PHP: require_once 'goutte.phar'; use Goutte\Client; $client = new Client(); $crawle ..
发布时间:2020-06-17 18:58:16 PHP

异步发送多个goutte请求

这是我正在使用的代码 require_once 'goutte.phar'; use Goutte\Client; $client = new Client(); for($i=0;$irequest('GET', 'http://website.com'); echo ' '.$crawler->filt ..
发布时间:2020-06-17 18:58:14 PHP

DOMCrawler无法正确转储数据以进行解析

我正在使用Symfony,Goutte和DOMCrawler抓取页面.不幸的是,该页面有许多老式的数据表,没有ID或类或标识因素.因此,我试图通过解析从请求中获得的源代码来查找表,但是我似乎无法访问任何信息 我认为当我尝试对其进行过滤时,它只会过滤第一个节点,而这并不是我想要的数据所在的位置,因此它什么也不会返回. 所以我有一个$crawler对象.而且我尝试遍历以下内容以获得所需的内 ..
发布时间:2020-06-17 18:58:12 PHP

如何使用古特

问题: 无法完全了解Goutte网页抓取工具. 请求: 有人可以帮助我理解或提供代码以帮助我更好地了解如何使用Goutte网络抓取工具吗?我已经阅读了README.md.我正在寻找比提供的信息更多的信息,例如Goutte中可用的选项以及如何编写这些选项,或者当您查看表单时,是否在搜索表单的name =或id =? 试图抓取网页布局: 第1步: 该网页有一个带有单选按钮的表单,用 ..
发布时间:2020-06-17 18:58:09 其他开发

如何从PHP脚本运行PHPUnit?

我正在使用PHPUnit和Goutte创建一个自定义测试应用程序.我想在自己的引导文件中加载Goutte库(以及测试所需的任何文件),然后在全部引导后启动PHPUnit测试运行程序. 我不确定如何在不从外部调用phpunit脚本的情况下执行此操作(这将是一个单独的过程,并且无法看到我的自举程序库).有人做过这样的事吗?最好的方法是什么? 解决方案 如果您引用,它告诉您关于setup( ..
发布时间:2020-05-27 19:55:14 PHP

Goutte不会加载ASP SSL页面

我正在尝试 Goutte ,这是一款基于Symfony2组件的PHP网络抓取工具。我已经成功地以纯文本和SSL形式检索了Google。但是,我遇到了一个无法加载的ASP / SSL页面。 这是我的代码: //加载一个爬虫/浏览器系统 require_once'porpor / goutte / goutte.phar'; //这是我们要解析的页面的演示 $ uri ='( ..
发布时间:2018-07-10 10:07:02 PHP

如何使用PHP Gouttee发送自定义标头

我在PHP cURL中有这个代码,可以解决阻塞问题。 $ headers = array( 'Accept:text / html,application / xhtml + xml,application / xml; q = 0.9,image / webp ,* / *; q = 0.8', 'Accept-Encoding:zip,deflate,sdch' ,'Accept-La ..
发布时间:2017-03-06 13:42:47 PHP

设置fabpot / goutte客户端的CURL参数

我正在使用goutte(fabpot / goutte)工作。当我尝试连接到https网站时,它会抛出一个错误,因为该网站正在使用自签名证书。我试图找到设置curl参数的方式忽略ssl证书是自签名的事实。 按照 https://github.com/FriendsOfPHP/Goutte 中的说明操作,我尝试了以下操作代码: $ this-> client = new Client(); ..
发布时间:2017-03-06 02:48:49 PHP

如何从需要cookie登录的网站中抓取PHP中的网站内容?

我的问题是,它不只需要一个基本的cookie,而是要求一个会话cookie和随机生成的ID。我想这意味着我需要使用带有cookie jar的web浏览器模拟器? 我试图使用Snoopy,Goutte和其他几个网络浏览器模拟器,但是因为我还没有能够找到如何接收cookies的教程。 任何人都可以给我一个如何接受Snoopy或Goutte中的Cookie的示例? 提前感谢! 解 ..
发布时间:2017-01-06 09:53:36 PHP