r相关内容

使用RSelum从网站(报纸档案)中抓取多个网页

根据解释,我设法从newspaper archive中抓取了一页here。 现在,我正在尝试通过运行一段代码来自动化访问页面列表的过程。 制作URL列表很容易,因为报纸的档案中有类似的链接模式: https://en.trend.az/archive/2021-XX-XX 问题在于编写一个循环来抓取标题、日期、时间、类别等数据。为简单起见,我尝试只使用2021-09-30到202 ..
发布时间:2022-09-02 17:51:26 前端开发

RSelum:抓取加载速度较慢的动态加载页面

我不确定是不是因为我的互联网速度很慢,但我正在尝试抓取一个在您向下滚动页面时加载信息的网站。我正在执行一个转到页面末尾的脚本,并等待Selify/Chrome服务器加载额外的内容。服务器确实会更新和加载新内容,因为我能够抓取最初不在页面上的信息,新内容会显示在Chrome查看器上,但它只更新一次。我将Sys.sleep()函数设置为每次等待一分钟,这样内容将有足够的时间加载,但它仍然不会多次更新。 ..
发布时间:2022-09-02 17:38:32 其他开发

源文件上未显示超文本标记语言表格

我正在尝试使用R(Packagervest)抓取网页上的表格数据。为此,数据需要位于html源文件中(这显然是rvest查找数据的地方),但在本例中并非如此。 但是,数据元素显示在检查面板的元素视图中: 源文件显示空表: 为什么数据显示在检查元素上而不显示在源文件上? 如何访问html格式的表格数据? 如果我无法通过html访问,我如何更改我的Web抓取策略? *网页 ht ..
发布时间:2022-09-02 17:29:12 前端开发

无法使用rvest抓取具有表单的网站

我正在尝试抓取下面列出的网站。我尝试通过使用rvest和下面的代码来完成此操作。 我的尝试是尝试复制我在Google Chrome中找到的PUT下载按钮。我不确定我做错了什么。我的reprex中列出了错误。 library(httr) library(rvest) library(dplyr) #> #> Attaching package: 'dplyr' #> The ..
发布时间:2022-09-02 17:00:10 其他开发

Dplyr:计算汇总组之间的百分比变化

我正在尝试计算组之间的变化百分比,其中有一个对照和几个处理,在我的数据框中被组织为组。因为我有很多观察,所以我使用dplyr。我不明白的是,如何有效地设定与哪一组进行比较?通常,我会将此任务分成多个步骤: 分组计算平均值 子集控制组以创建新的“控件”数据帧 将“控制”数据帧联接到第一个DF 计算对照和处理之间的变化百分比。 不过,我想知道dplyr是否已经有了一个更简单、更直截了 ..
发布时间:2022-09-02 16:29:07 其他开发

编写脚本以忽略在r中找不到的对象

我正在尝试在r中构造一个脚本,以强制它忽略找不到的对象。 我的脚本的简化版本如下 试用<;-sum(a,b,c,d,e) A-e是通过计算数据框中列的总和生成的数值向量。 我的问题是我想在多个不同的条件下使用相同的脚本(并且拥有比a-e多得多的对象)。对于这些情况中的一些,对象a-e中的一些可能不存在。因此,%r返回错误对象%d未找到。 为避免为每个条件生成唯一的 ..
发布时间:2022-09-02 15:47:33 其他开发

用R中的滚动平均值来归因于缺失值

我是R新手,正在解决一个问题。 我需要一个函数来根据给定大小的窗口中元素的平均值来计算向量中的缺失值。 但是,此窗口将移动,因为假设MyNA位于位置30,而我的窗口大小为10,则应计算x[20:40]的平均值。因此,对于每个找到的NA,窗口平均值将不同。 我一直在尝试: impute.to.window.mean ..
发布时间:2022-09-02 15:24:11 其他开发

使用来自库MICE()的输入数据集来拟合R中的多水平模型

我刚开始在R中打包mice,但我正在尝试计算popmis中的5个数据集,然后分别匹配lmer()模型with()和最后的pool()。 我认为mice()中的pool()函数不适用于lme4包中的lmer()调用,对吗? 如果是这样的话,有没有办法编写一个定制的函数,它的作用类似于我下面的案例pool()? library(mice) library(lme4) imp ..
发布时间:2022-09-02 14:36:07 其他开发