首页
前端开发
用sed提取HTML标签数据

用sed提取HTML标签数据 [英] Extract HTML tag data with sed

查看：126 发布时间：2018/6/21 13:47:19 html sed tags

本文介绍了用sed提取HTML标签数据的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我希望在已知的HTML标签之间提取数据。例如：

您好，< i> I< i>非常< i>< / i>很高兴见到你。

 
 
 应该变成： 
 
 
'I 
 
 
 非常'
 
 
 所以我发现了一些可以用于几乎的事情。不幸的是，它只提取最后一个条目。
 
 
   sed -n -e's /.*& lt; i> \（。* \\ \\）现在我可以追加任何结束标记<$ c

$ c>< / i> 换行符，这很好。但是有没有一种方法可以用一个sed命令来完成呢？
解决方案
试试这个：
sed -n's | [^<] *< i> \（[^<] * \）< / i> ; [^<] * | \1\\\ | gp'
你的例子是缺少/：

您好，< i> I< / i>非常< i>< / i>很高兴认识你。

I wish to extract data between known HTML tags. For example:

Hello, <i>I<i> am <i>very</i> glad to meet you.

Should become:

'I

very'

So I have found something that works to nearly do this. Unfortunately, it only extracts the last entry.

sed -n -e 's/.*<i>\(.*\)<\/i>.*/\1/p'

Now I can append any end tag </i> with a newline character and this works fine. But is there a way to do it with just one sed command?
解决方案
Give this a try:
sed -n 's|[^<]*<i>\([^<]*\)</i>[^<]*|\1\n|gp'
And your example is missing a "/":
Hello, <i>I</i> am <i>very</i> glad to meet you.

这篇关于用sed提取HTML标签数据的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

相关文章

用sed提取json值;

用Java提取HTML数据;

linux - sed去html标签？？？;

SED删除HTML文件标签;

用Python从HTML中提取数据;

更换使用SED HTML标签内容;

使用 sed 替换 HTML 标签内容;

sed命令从HTML中提取文本;

使用 SED 在 XML 标签之间提取值;

如何使用sed命令提取数据;

sed 从 html 文件中删除标签;

删除sed或类似的html标签;

用grep/sed从XML文件中提取单词;

如何在相同的html标签之间提取数据;

(美丽的汤)如何从HTML标签提取数据;

在标签之间提取HTML;

HTML敏捷提取PHP标签;

在标签之间提取 HTML;

用html编码标签;

删除 sed 或类似中的 html 标签;

sed - 如何使用 sed 提取 IP 地址?;

从html中提取标题标签;

提取 HTML 标签之间的文本;

用Java剥离HTML标签;

用hxt提取多个html表格;

前端开发最新文章

为什么Chrome（在Electron内部）突然重定向到chrome-error：// chromewebdata？;

错误102（net :: ERR_CONNECTION_REFUSED）：服务器拒绝连接;

如何解决'重定向已被CORS策略阻止：没有'Access-Control-Allow-Origin'标题'？;

如何处理“Uncaught（in promise）DOMException：play（）失败，因为用户没有首先与文档交互。”在桌面上使用Chrome 66？;

警告：添加非被动事件侦听器到滚动阻塞'touchstart'事件;

如何在浏览器中播放.TS文件（视频/ MP2T媒体类型）？;

此请求已被阻止;内容必须通过HTTPS提供;

资源解释为样式表，但转换为MIME类型text / html（似乎与web服务器无关）;

通过HTTPS加载页面但请求不安全的XMLHttpRequest端点;

拒绝从执行脚本'*'，因为它的MIME类型（“应用/ JSON'）不是可执行文件，并严格MIME类型检查被启用。;

热门教程

Java教程

Apache ANT 教程

Kali Linux教程

JavaScript教程

JavaFx教程

MFC 教程

Apache HTTP客户端教程

Microsoft Visio 教程

热门工具

Java 在线工具

C(GCC) 在线工具

PHP 在线工具

C# 在线工具

Python 在线工具

MySQL 在线工具

VB.NET 在线工具

Lua 在线工具

Oracle 在线工具

C++(GCC) 在线工具

Go 在线工具

Fortran 在线工具

登录关闭

扫码关注1秒登录

发送“验证码”获取 | 15天全站免登陆

友情链接： IT屋 Chrome插件谷歌浏览器插件

IT屋 ©2016-2022 琼ICP备2021000895号-1 站点地图站点标签 SiteMap <免责申明> 本站内容来源互联网,如果侵犯您的权益请联系我们删除.