使用rvest对Google搜索结果进行Web擦除时出现字符(0)错误 [英] Character(0) error when using rvest to webscrape Google search results

查看:0
本文介绍了使用rvest对Google搜索结果进行Web擦除时出现字符(0)错误的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试搜索谷歌搜索的标题。但是,无论我用rvest尝试什么,结果总是返回character(0)

以下是搜索rstudio的代码:

library(rvest)
library(dplyr)

web1 <- read_html("https://www.google.at/search?q=rstudio") 
header <-web1 %>%
    html_nodes(".DKV0Md") %>%
    html_text()
header 

我签入的节点名SelectorGadget,所以这应该不是问题。我应该如何解决此问题?

推荐答案

或许我们可以使用:

library(rvest)
library(dplyr)
web1 %>% 
   html_nodes(xpath = '//div/div/div/a/div[not(div)]') %>% 
   html_text

输出:

#[1] "rstudio.com"        
#[2] "rstudio.cloud"           
#[3] "en.wikipedia.org › wiki › RStudio"    
# ....

这篇关于使用rvest对Google搜索结果进行Web擦除时出现字符(0)错误的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆