正则表达式 - PHP如何获取HTML一个元素里面的内容

查看:471
本文介绍了正则表达式 - PHP如何获取HTML一个元素里面的内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

目前我是通过从网上抄来的正则实现的,可是并不能达到我想要效果。

目前我的方案是:

 $text=file_get_contents('404.html');
 preg_match('/<time[^>]*itemprop=\"datePublished\".*?>.*?<\/time>/ism',$text,$match); 
print($match[0]); 

可是最终输出的内容是

<time datetime="2017-02-20T18:41:00+08:00" itemprop="datePublished">2017年2月20日</time>

我想要的是输出2017年2月20日,也就是原因里面的内容,可是对正则不了解,看了百科完全一脸懵逼。请问该如何实现?或是正则该怎么写才能输出里面的内容

解决方案

这个time就是类似html标签,你用php的去html标签函数,吧这个嵌套的标签去掉,就可以了呀,看一下下面的代码,用去标签函数strip_tags()试试。具体的更多用法,你可查手册。

$text=file_get_contents('404.html');
 preg_match('/<time[^>]*itemprop=\"datePublished\".*?>.*?<\/time>/ism',$text,$match); 
print(strip_tags($match[0])); 

这篇关于正则表达式 - PHP如何获取HTML一个元素里面的内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆