使用“rvest"提取链接 [英] Using 'rvest' to extract links

查看:62
本文介绍了使用“rvest"提取链接的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试从 Yelp 中抓取数据.一个步骤是从每家餐厅中提取链接.例如,我在纽约搜索餐馆并得到一些结果.然后我想提取 Yelp 在第 1 页推荐的所有 10 家餐厅的链接.这是我尝试过的:

I am trying to scrape data from Yelp. One step is to extract links from each restaurant. For example, I search restaurants in NYC and get some results. Then I want to extract the links of all the 10 restaurants Yelp recommends on page 1. Here is what I have tried:

library(rvest)     
page=read_html("http://www.yelp.com/search?find_loc=New+York,+NY,+USA")
page %>% html_nodes(".biz-name span") %>% html_attr('href')

但代码总是返回NA".任何人都可以帮助我吗?谢谢!

But the code always returns 'NA'. Can anyone help me with that? Thanks!

推荐答案

library(rvest)     
page <- read_html("http://www.yelp.com/search?find_loc=New+York,+NY,+USA")
page %>% html_nodes(".biz-name") %>% html_attr('href')

希望这能简化您的问题

这篇关于使用“rvest"提取链接的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆