rselenium相关内容

RSelum:抓取加载速度较慢的动态加载页面

我不确定是不是因为我的互联网速度很慢,但我正在尝试抓取一个在您向下滚动页面时加载信息的网站。我正在执行一个转到页面末尾的脚本,并等待Selify/Chrome服务器加载额外的内容。服务器确实会更新和加载新内容,因为我能够抓取最初不在页面上的信息,新内容会显示在Chrome查看器上,但它只更新一次。我将Sys.sleep()函数设置为每次等待一分钟,这样内容将有足够的时间加载,但它仍然不会多次更新。 ..
发布时间:2022-09-02 17:38:32 其他开发

使用 R 来“点击"网页上的下载文件按钮

我正在尝试使用此网页 http://volcano.si.edu/search_eruption.cfm 来抓取数据.有两个下拉框要求对数据进行过滤.我不需要过滤的数据,所以我将这些数据留空,然后点击“搜索喷发"继续到下一页. 不过,我注意到结果表只包含少量列(只有 5 个),而它应该包含的列总数(总共 24 个)相比.但是,如果您单击“将结果下载到 Excel",所有 24 列都将存在.按 ..
发布时间:2021-12-18 15:02:26 其他开发

无法执行 rsDriver(连接被拒绝)

我无法使用 R selenium.这是第一步和我的输出: 库(RSelenium)rD 了解更多信息的文档: https://cran.r-project.org/web/packages/RSelenium/vignettes/RSelenium-basics.html https://cran.r-project.org/web/packages/RSelenium/vignet ..
发布时间:2021-12-07 11:33:46 其他开发

会话未创建:此版本的 ChromeDriver 仅支持使用 Selenium 的 ChromeDriver Chrome 的 Chrome 版本 74 错误

我正在尝试使用 rsDriver 函数运行 RSelenium,但是当我运行时rD 我收到一条消息,告诉我我需要更新版本的 Chrome: >rD ?rsDriver() 帮助页面. 如果您按照帮助文档中的说明运行代码binman::list_versions("chromedriver"),那么您可以识别与该功能兼容的版本.就我而言,我能够使用以下代码建立连接. driver ..

使用 R 从 TripAdvisor 抓取数据

我想创建一个爬虫来从 Trip Advisor 中抓取一些数据.理想情况下,它将(a) 确定要抓取的所有位置的链接,(b) 收集每个地点所有景点的链接,并(c) 将收集所有评论的目的地名称、日期和评分.我现在想专注于 (a) 部分. 这是我开始使用的网站:http://www.tripadvisor.co.nz/Tourism-g255104-New_Zealand-Vacations.ht ..
发布时间:2021-10-02 19:28:29 其他开发

Rselenium - 端口 4445:连接被拒绝

我想使用 R Selenium 进行一些网络抓取,但是出现连接错误.看看一个简单的代码和输出: 库(开发工具)图书馆(XML)图书馆(caTools)图书馆(宾曼)图书馆(wdman)图书馆(yaml)图书馆(wdman)图书馆(RSelenium)>system('docker pull selenium/standalone-firefox')使用默认标签:最新最新:从 selenium/s ..
发布时间:2021-09-24 19:06:17 其他开发

使用 RSelenium 用 R 刮表

我想抓取一个类似于this 的表格(点击搜索,您将获得一张合作伙伴表格).我想刮掉合作伙伴的名字.问题是我不知道这是一张什么样的桌子,也不知道如何刮它. 我正在使用 RSelenium 包.如果可以使用 rvest 来完成,那将会很有帮助. 那么这是一个什么样的表,是否可以用 RSelenium 或 rvest 抓取它,如果是,如何抓取? ul="http://partnerloca ..
发布时间:2021-09-24 19:04:45 Java开发

如何在 Rselenium 中释放按键

我尝试成功按下控制键: rD 但问题是我不能释放这个键,所以如果我点击另一个链接它会创建一个新标签. 我在 google 和 stackoverflow 上搜索过,但还没有找到 Rselenium 的解决方案. 解决方案 文档中没有,但我再次尝试按下控制,再次按下释放了按键. 示例: 无需按两次,将打开一个新选项卡.但是使用 sendKeysToActiveElement( ..
发布时间:2021-09-24 18:57:31 其他开发