使用 xpath 解析 bash XHTML [英] bash XHTML parsing using xpath

查看:24
本文介绍了使用 xpath 解析 bash XHTML的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在编写一个小脚本来学习如何解析 XHTML 网页.以下命令:

I'm writing a small script to learn how to parse an XHTML web page. The following command:

cat q?s=goog.xhtml | xpath '//span[@id="yfs_l10_goog"]'

返回:

Found 2 nodes:
-- NODE --
<span id="yfs_l10_goog">624.50</span>-- NODE --
<span id="yfs_l10_goog">624.50</span>

我该怎么做:

  • 需要编写我的命令以便仅提取值 624.50 吗?

我需要做什么才能只提取一次?

what do I need to do to extract it only once ?

我正在解析的源页面:http://finance.yahoo.com/q?s=goog

source page I'm parsing: http://finance.yahoo.com/q?s=goog

推荐答案

试试这个:

xpath -q -e '//span[@id="yfs_l10_goog"][1]/text()'

通过管道输出您的输出:

Pipe your output through:

sed -n '/span/{s/<span[^<]*>([^<]*)<.*/1/;p;q}'

原答案:

使用 xmlstarlet:

echo -e '<foo><span id="yfs_l10_goog">624.50</span>
<bar>xyz</bar><span id="yfs_l10_goog">555.50</span>
<span id="yfs_l10_goog">123.50</span></foo>' | 
    xmlstarlet sel -t -v "//span[@id='yfs_l10_goog']"

查询结果:

624.50

echo的结果:

<foo><span id="yfs_l10_goog">624.50</span>
<bar>xyz</bar><span id="yfs_l10_goog">555.50</span>
<span id="yfs_l10_goog">123.50</span></foo>

xml fo的结果:

<?xml version="1.0"?>
<foo>
  <span id="yfs_l10_goog">624.50</span>
  <bar>xyz</bar>
  <span id="yfs_l10_goog">555.50</span>
  <span id="yfs_l10_goog">123.50</span>
</foo>

其他查询:

$ echo -e '...' | xmlstarlet sel -t -v "//span[@id='yfs_l10_goog'][1]"
624.50
$ echo -e '...' | xmlstarlet sel -t -v "//span[@id='yfs_l10_goog'][3]"
123.50
$ echo -e '...' | xmlstarlet sel -t -v "//span[@id='yfs_l10_goog'][last()]"
123.50

这篇关于使用 xpath 解析 bash XHTML的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆