使用 xpath 解析 bash XHTML [英] bash XHTML parsing using xpath
本文介绍了使用 xpath 解析 bash XHTML的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在编写一个小脚本来学习如何解析 XHTML 网页.以下命令:
I'm writing a small script to learn how to parse an XHTML web page. The following command:
cat q?s=goog.xhtml | xpath '//span[@id="yfs_l10_goog"]'
返回:
Found 2 nodes:
-- NODE --
<span id="yfs_l10_goog">624.50</span>-- NODE --
<span id="yfs_l10_goog">624.50</span>
我该怎么做:
需要编写我的命令以便仅提取值
624.50
吗?
我需要做什么才能只提取一次?
what do I need to do to extract it only once ?
我正在解析的源页面:http://finance.yahoo.com/q?s=goog
source page I'm parsing: http://finance.yahoo.com/q?s=goog
推荐答案
试试这个:
xpath -q -e '//span[@id="yfs_l10_goog"][1]/text()'
通过管道输出您的输出:
Pipe your output through:
sed -n '/span/{s/<span[^<]*>([^<]*)<.*/1/;p;q}'
原答案:
使用 xmlstarlet
:
echo -e '<foo><span id="yfs_l10_goog">624.50</span>
<bar>xyz</bar><span id="yfs_l10_goog">555.50</span>
<span id="yfs_l10_goog">123.50</span></foo>' |
xmlstarlet sel -t -v "//span[@id='yfs_l10_goog']"
查询结果:
624.50
echo
的结果:
<foo><span id="yfs_l10_goog">624.50</span>
<bar>xyz</bar><span id="yfs_l10_goog">555.50</span>
<span id="yfs_l10_goog">123.50</span></foo>
xml fo
的结果:
<?xml version="1.0"?>
<foo>
<span id="yfs_l10_goog">624.50</span>
<bar>xyz</bar>
<span id="yfs_l10_goog">555.50</span>
<span id="yfs_l10_goog">123.50</span>
</foo>
其他查询:
$ echo -e '...' | xmlstarlet sel -t -v "//span[@id='yfs_l10_goog'][1]"
624.50
$ echo -e '...' | xmlstarlet sel -t -v "//span[@id='yfs_l10_goog'][3]"
123.50
$ echo -e '...' | xmlstarlet sel -t -v "//span[@id='yfs_l10_goog'][last()]"
123.50
这篇关于使用 xpath 解析 bash XHTML的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文