javascript - Python逐行读取txt中的url文件并进行爬虫

查看：418 发布时间：2017/9/6 11:36:49 html java javascript php python

本文介绍了javascript - Python逐行读取txt中的url文件并进行爬虫的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

问题

毕设项目需要爬取coursera的课程数据，已经把所有课程的url链接爬下来了，存在了txt中，一行是一个课程的url，现在想要获取每门课程的详细信息，如instructor，syllabus 和detail information这几项，但是都需要点进各个课程的网页链接中取爬取。码渣求大神指导一下，来段伪码就更好啦！thx

解决方案

你好！不知道这是不是你想要的答案：

f = open("coursera.txt","r")
urlList = f.readlines()
for url in urlList:
    r = requests.get(url)
    ''''''

Good Luck ! ^_<

这篇关于javascript - Python逐行读取txt中的url文件并进行爬虫的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

javascript - Python逐行读取txt中的url文件并进行爬虫

问题描述

相关文章

Java开发最新文章

热门教程

热门工具

登录关闭

javascript - Python逐行读取txt中的url文件并进行爬虫

问题描述

相关文章

Java开发最新文章

热门教程

热门工具

登录 关闭

登录关闭