首页
PHP
从HTML内容中提取数据

从HTML内容中提取数据 [英] Extract the data from content of HTML

查看：141 发布时间：2018/6/26 20:15:52 php html curl

本文介绍了从HTML内容中提取数据的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我试图从HTML中提取数据。我用curl做了，但我需要的只是将标题传递给另一个变量：

 < meta property =og ：urlcontent =https://example.com/>

如何提取这个，还有更好的方法吗？

解决方案

您应该使用解析器将值从HTML文件/字符串/文档中提取出来。

  $ string ='< meta property =og：urlcontent =https： //example.com/\">'; 
 $ doc = new DOMDocument（）; 
 $ doc-> loadHTML（$ string）; 
 $ metas = $ doc-> getElementsByTagName（'meta'）; 
 foreach（$ metas as $ meta）{
 if（$ meta-> getAttribute（'property'）=='og：url'）{
 echo $ meta-> getAttribute （'内容'）; 
 
 
 $ / code $ / pre 
 $ b $输出：
 
 
 
   https://example.com/  
 
 
 
I'm trying to extract data from HTML.  I did it with curl, but all I need is to pass the title to another variable:
<meta  property="og:url" content="https://example.com/">
How to extract this, and is there a better way?
 解决方案 
You should use a parser to pull values out of HTML files/strings/docs. Here's an example using the domdocument.
$string = '<meta  property="og:url" content="https://example.com/">';
$doc = new DOMDocument();
$doc->loadHTML($string);
$metas = $doc->getElementsByTagName('meta');
foreach($metas as $meta) {
    if($meta->getAttribute('property') == 'og:url') {
        echo $meta->getAttribute('content');
    }
}
Output:

  https://example.com/


                        
这篇关于从HTML内容中提取数据的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            从HTML中提取内容？;
                        
                    
                    
                        
                            从gitlab网址中提取html内容;
                        
                    
                    
                        
                            从 HTML 表格中提取数据;
                        
                    
                    
                        
                            从HTML表格中提取数据;
                        
                    
                    
                        
                            如何从以下html中提取数据?;
                        
                    
                    
                        
                            从HTML表格行列中提取数据;
                        
                    
                    
                        
                            PHP:从网站中提取 HTML 数据;
                        
                    
                    
                        
                            如何从HTML页面中提取数据？;
                        
                    
                    
                        
                            从HTML页面中提取csv数据;
                        
                    
                    
                        
                            用Python从HTML中提取数据;
                        
                    
                    
                        
                            使用 python 和 BeautifulSoup 从 html 中提取表格内容;
                        
                    
                    
                        
                            如何从TinyMCE编辑器中提取HTML内容;
                        
                    
                    
                        
                            如何从对象中提取内容？;
                        
                    
                    
                        
                            从存储的 .html 页面中提取新闻文章内容;
                        
                    
                    
                        
                            如何从 &lt;p&gt; 中提取内容HTML 标签;
                        
                    
                    
                        
                            使用PHP从div类中提取所有内容（包括HTML）;
                        
                    
                    
                        
                            从存储的.html页面中提取新闻文章内容;
                        
                    
                    
                        
                            从标记中提取HTML5数据属性;
                        
                    
                    
                        
                            在Java中从HTML中提取微数据;
                        
                    
                    
                        
                            使用 AWK/Grep/Bash 从 HTML 中提取数据;
                        
                    
                    
                        
                            使用AWK / Grep / Bash从HTML中提取数据;
                        
                    
                    
                        
                            从HTML表格单元格中提取数据;
                        
                    
                    
                        
                            如何从PHP的HTML表中提取数据?;
                        
                    
                    
                        
                            在php中提取HTML页面的内容;
                        
                    
                    
                        
                            从 html 链接中提取标题;


    
        
            PHP最新文章
            
                    
                        
                            请求头字段Access-Control-Allow-Headers在预检响应中不允许Access-Control-Allow-Headers;
                        
                    
                    
                        
                            路由问题导致Symfony \ Component \ HttpKernel \ Exception \ NotFoundHttpException错误;
                        
                    
                    
                        
                            什么是NCFB和NOFB模式？;
                        
                    
                    
                        
                            警告：mysqli_connect（）：（HY000 / 1045）：访问被拒绝用户'用户名'@'localhost'（使用密码：是）;
                        
                    
                    
                        
                            如何处理致命错误：cURL错误7：无法连接到xxxx端口443;
                        
                    
                    
                        
                            参数3传递给GuzzleHttp\Client :: request（）必须是数组类型，给定字符串;
                        
                    
                    
                        
                            phpMyAdmin的＃2054无法登录到MySQL服务器;
                        
                    
                    
                        
                            SSL错误SSL3_GET_SERVER_CERTIFICATE：证书验证失败;
                        
                    
                    
                        
                            在PHPExcel中设置字体颜色，字体和字体大小;
                        
                    
                    
                        
                            如何解决cURL错误（7）：无法连接到主机？;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.