如何从给定网站中提取社交信息? [英] How to extract social information from a given website?

查看:75
本文介绍了如何从给定网站中提取社交信息?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个像 www.example.com 这样的网站网址

I have a Website URL Like www.example.com

我想从本网站收集社交信息,例如:facebook url (facebook.com/example)、twitter url (twitter.com/example) 等,如果在任何地方、网站的任何页面上都可用.

I want to collect social information from this website like : facebook url (facebook.com/example ), twitter url ( twitter.com/example ) etc., if available anywhere, at any page of website.

如何完成此任务,建议任何教程、博客、技术..

How to complete this task, suggest any tutorials, blogs, technologies ..

推荐答案

import requests
from html_to_etree import parse_html_bytes
from extract_social_media import find_links_tree

res = requests.get('http://www.jpmorganchase.com')
tree = parse_html_bytes(res.content, res.headers.get('content-type'))

set(find_links_tree(tree))

来源:https://github.com/fluquid/extract-social-media

这篇关于如何从给定网站中提取社交信息?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆