检索网页内容...... [英] Retrieval of a webpage content...

查看:76
本文介绍了检索网页内容......的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

HI朋友

我正在进行网页摘要的最后一年项目。

我需要一个来自你的人... :(我的项目是关于总结谷歌页面链接,并提供这些链接的简短摘要在我们去谷歌的每个链接下面的片段的地方搜索。

开始这个ive检索所有这10个链接的内容...为此我尝试使用网络爬虫,html2txt s / w'但所有都以失败结束..

请有人指导我检索谷歌搜索给出的网页链接中的内容。我使用抓取工具检索所有内容..就像搜索结果页面中的所有超链接一样。

我在谈论那些由谷歌引擎返回的10个链接以回复我们的查询...请帮助我..还有3个月来完成我的项目:(



紧急删除 - OriginalGriff [/ edit]

解决方案

阅读本文:http:// www.codersource.net/MicrosoftNet/CAdvanced/HTMLScreenScrapinginC.aspx [ ^ ]



这是一个Windows应用程序,他只是在页面上获取链接,但它应该让你的头朝右方向。

HI friends
Im doing my final year project on Web page summarization.
I need an from u ppl... :( My project is all about summarizing the google page links and provide a short abstract of those links in the place of snippets below each link when we go for google search.
To start this ive to retrieve the contents of all those 10 links... For this i tried using web crawlers , html2txt s/w''s but all ended in failure..
Please someone guide me to retrieve the contents in the web page links given by google search. Whe i used crawlers it retrieved all the contents.. like all the hyper links from that search result page.
Im talking about those 10 links alone which are returned by the google engine in return to our query... Please help me.. Still ive oly 3months to complete my project :(

[edit]Urgency deleted - OriginalGriff[/edit]

解决方案

Read over this: http://www.codersource.net/MicrosoftNet/CAdvanced/HTMLScreenScrapinginC.aspx[^]

It''s a windows application and he is just getting the links on a page but it should get your headed in the right direction.


这篇关于检索网页内容......的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆