首页
前端开发
提取正则表达式匹配的一部分

提取正则表达式匹配的一部分 [英] Extract part of a regex match

查看：157 发布时间：2018/6/13 15:54:35 python html regex html-content-extraction

本文介绍了提取正则表达式匹配的一部分的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我想要一个正则表达式从HTML页面中提取标题。目前我有这样的：

  title = re.search（'< title>。*< / title>'，html （'< title>，''）.replace

是否有正则表达式来提取内容，因此我不必删除标记？

谢谢！

解决方案使用 （ ）在regexp和 group（1） 在python中检索捕获的字符串（ re.search 将返回没有如果没有找到结果，所以不直接使用 group（））：
title_search = re.search（'< title>（。*）< / title>'，html，re.IGNOREC ASE）如果title_search： title = title_search.group（1）

I want a regular expression to extract the title from a HTML page. Currently I have this:
title = re.search('<title>.*</title>', html, re.IGNORECASE).group() if title: title = title.replace('<title>', '').replace('</title>', '')
Is there a regular expression to extract just the contents of so I don't have to remove the tags?

thanks!
解决方案
Use ( ) in regexp and group(1) in python to retrieve the captured string (re.search will return None if it doesn't find the result, so don't use group() directly):
title_search = re.search('<title>(.*)</title>', html, re.IGNORECASE) if title_search: title = title_search.group(1)

这篇关于提取正则表达式匹配的一部分的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

相关文章

仅替换正则表达式匹配的一部分;

Python正则表达式；替换匹配的一部分;

只返回正则表达式匹配的一部分;

仅从正则表达式返回匹配的一部分;

重复正则表达式的一部分?;

返回从正则表达式匹配只有一部分;

重用正则表达式模式的一部分;

获取 URL 的一部分(正则表达式);

获取URL的一部分(正则表达式);

如何匹配但不捕获正则表达式的一部分?;

JMeter-选择正则表达式的一部分;

使用正则表达式选择字段的一部分;

python正则表达式替换匹配字符串的一部分;

使用正则表达式获取url的最后一部分;

正则表达式:忽略字符串的一部分;

替换为正则表达式保留模式的一部分;

使用正则表达式获取 url 的最后一部分;

用匹配的正则表达式的一部分替换字符串;

正则表达式帮助提取字符串的某一部分;

网址第一部分的子串正则表达式;

如何使正则表达式匹配的一部分成为可选?;

R中的正则表达式:仅替换模式的一部分;

在匹配的正则表达式的一部分上拆分字符串(python);

正则表达式以获取字符串的一部分;

Powershell 正则表达式获取字符串的一部分;

前端开发最新文章

为什么Chrome（在Electron内部）突然重定向到chrome-error：// chromewebdata？;

错误102（net :: ERR_CONNECTION_REFUSED）：服务器拒绝连接;

如何解决'重定向已被CORS策略阻止：没有'Access-Control-Allow-Origin'标题'？;

如何处理“Uncaught（in promise）DOMException：play（）失败，因为用户没有首先与文档交互。”在桌面上使用Chrome 66？;

警告：添加非被动事件侦听器到滚动阻塞'touchstart'事件;

如何在浏览器中播放.TS文件（视频/ MP2T媒体类型）？;

此请求已被阻止;内容必须通过HTTPS提供;

资源解释为样式表，但转换为MIME类型text / html（似乎与web服务器无关）;

通过HTTPS加载页面但请求不安全的XMLHttpRequest端点;

拒绝从执行脚本'*'，因为它的MIME类型（“应用/ JSON'）不是可执行文件，并严格MIME类型检查被启用。;

热门教程

Java教程

Apache ANT 教程

Kali Linux教程

JavaScript教程

JavaFx教程

MFC 教程

Apache HTTP客户端教程

Microsoft Visio 教程

热门工具

Java 在线工具

C(GCC) 在线工具

PHP 在线工具

C# 在线工具

Python 在线工具

MySQL 在线工具

VB.NET 在线工具

Lua 在线工具

Oracle 在线工具

C++(GCC) 在线工具

Go 在线工具

Fortran 在线工具

登录关闭

扫码关注1秒登录

发送“验证码”获取 | 15天全站免登陆

友情链接： IT屋 Chrome插件谷歌浏览器插件

IT屋 ©2016-2022 琼ICP备2021000895号-1 站点地图站点标签 SiteMap <免责申明> 本站内容来源互联网,如果侵犯您的权益请联系我们删除.