得到nu.nl新闻标题中的文本文件 [英] Get news headlines from nu.nl in a text file

查看:142
本文介绍了得到nu.nl新闻标题中的文本文件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想有nu.nl的新闻标题中的文本文件,这样我可以在我的bash脚本之一使用它们。我想提取这些标题与一个bash脚本为好。

I'd like to have the news headlines of nu.nl in a text file, so that I can use them in one of my bash scripts. I want to extract these headlines with a bash script as well.

我已经加入今天的nu.nl的网页截图( HTTP://i.stack .imgur.com / gS2mp.png )。例如,我想在一个文本文件:

I have added a screenshot of nu.nl's homepage of today (http://i.stack.imgur.com/gS2mp.png). For example, I'd like to have in a textfile:

"Ook met Grieks referendum houdt Eurogroep vandaag nog overleg <br/>
Koeweit pakt verdachten van aanslag op <br/>
Ruim 4 op de 5 boetes voor te hard rijden <br/>
... et cetera"

我在Ubuntu 14.04.2 LTS(GNU / Linux的3.16.0-41-x86_64的仿制)

I am programming bash scripts on Ubuntu 14.04.2 LTS (GNU/Linux 3.16.0-41-generic x86_64)

推荐答案

使用XML解析器(xmlstarlet,xmllint ...)来分析一个或多个的 RSS因子

Use an XML parser (xmlstarlet, xmllint ...) to parse one or more of its rss feeds:

wget -O - http://www.nu.nl/rss/Algemeen 2>/dev/null | xmlstarlet sel -t -v /rss/channel/item/title | sed 's|$| <br/>|'

输出:

Lange rijen voor pinautomaten Griekenland <br/>
A9 afgesloten vanwege groot ongeval <br/>
'Schutter aanslag Sousse was een Tunesiër' <br/>
Koning, premier en minister Hennis bij Veteranendag in Den Haag <br/>
'Koeweit pakt verdachten van aanslag op' <br/>
Ruim 4 op de 5 boetes zijn voor te hard rijden <br/>
Witte Huis verlicht met regenboogkleuren om homohuwelijk VS <br/>
'Te veel leraren staan zonder diploma voor de klas' <br/>
Vliegtuig met Nederlandse toeristen uit Tunesië geland op Schiphol <br/>
Ernstige mishandeling en aanhoudingen bij TT Assen <br/>

这篇关于得到nu.nl新闻标题中的文本文件的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆