首页
前端开发
在php上需要一个好的HTML解析器

在php上需要一个好的HTML解析器 [英] Need a good HTML parser on php

查看：104 发布时间：2018/6/22 20:49:29 html parsing

本文介绍了在php上需要一个好的HTML解析器的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

找到这一个 http://simplehtmldom.sourceforge.net/ ，但它失败了

 解压此页面http://php.net/manual/en/function.curl-setopt.php 
和解析为纯html，失败并返回一个部分html页面

这就是我想要做的，
转到一个html页面并获取组件个体（层次结构中所有div和p的内容）
我喜欢simplehtmldom的特性，任何这样的解析器都是必需的，它对所有代码都很好（最好和最差）。

解决方案

我经常使用 DOMDocument :: loadHTML ，这在一般情况下效果不错，而且我喜欢查询文档，一旦它们作为DOM加载，使用 Xpath 那时你开始明白尊重网络标准是一个好主意......

Found this one http://simplehtmldom.sourceforge.net/ but it has failed to work

extracting this page http://php.net/manual/en/function.curl-setopt.php
and parse it to plain html, it failed and returned a partial html page

This is what I want to do, Go to a html page and get the components individual( the contents of all div and p in a hierarchy ) I like the features of simplehtmldom any such parser is required which is good at all code(best and worst).

解决方案

I often use DOMDocument::loadHTML, which works not too bad, in the general cases -- and I like querying the documents, once they are loaded as DOM, with Xpath.



Unfortunatly, I suppose that, in some cases, if the HTML page is really to badly-formed, some parsing problems can occur... That's when you start understanding that respecting web-standards is a great idea...

                        这篇关于在php上需要一个好的HTML解析器的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            任何好的Java HTML解析器？;
                        
                    
                    
                        
                            PHP HTML DOM解析器;
                        
                    
                    
                        
                            一个正则表达式解析器在PHP?;
                        
                    
                    
                        
                            需要一个快速的解析器为我的项目;
                        
                    
                    
                        
                            PHP SAX解析器的HTML吗?;
                        
                    
                    
                        
                            PHP简单的HTML DOM解析器;
                        
                    
                    
                        
                            我需要一个快速运行的前pression解析器;
                        
                    
                    
                        
                            什么是好的 php 解析器生成器?;
                        
                    
                    
                        
                            什么是php好的解析器生成器?;
                        
                    
                    
                        
                            HTML Dom解析器获取第一个元素;
                        
                    
                    
                        
                            手工编写一个解析器;
                        
                    
                    
                        
                            选择一个Haskell解析器;
                        
                    
                    
                        
                            编写一个简单的解析器;
                        
                    
                    
                        
                            创建一个简单的解析器;
                        
                    
                    
                        
                            开发一个简单的解析器;
                        
                    
                    
                        
                            HTML解析器;
                        
                    
                    
                        
                            PHP简单HTML DOM解析器死;
                        
                    
                    
                        
                            缓存PHP简单的HTML DOM解析器;
                        
                    
                    
                        
                            生成解析器，该解析器在另一个解析器的输出上运行接收的解析器，并单次连接结果;
                        
                    
                    
                        
                            哪里有好的地址解析器;
                        
                    
                    
                        
                            任何好的JavaScript BBCode解析器？;
                        
                    
                    
                        
                            PHP简单HTML DOM解析器如何仅从第一个表获取TR;
                        
                    
                    
                        
                            解析器上带有参数的解析器;
                        
                    
                    
                        
                            去 - 如何创建一个解析器;
                        
                    
                    
                        
                            寻找一个PDF文件解析器;


    
        
            前端开发最新文章
            
                    
                        
                            为什么Chrome（在Electron内部）突然重定向到chrome-error：// chromewebdata？;
                        
                    
                    
                        
                            错误102（net :: ERR_CONNECTION_REFUSED）：服务器拒绝连接;
                        
                    
                    
                        
                            如何解决'重定向已被CORS策略阻止：没有'Access-Control-Allow-Origin'标题'？;
                        
                    
                    
                        
                            如何处理“Uncaught（in promise）DOMException：play（）失败，因为用户没有首先与文档交互。”在桌面上使用Chrome 66？;
                        
                    
                    
                        
                            警告：添加非被动事件侦听器到滚动阻塞'touchstart'事件;
                        
                    
                    
                        
                            如何在浏览器中播放.TS文件（视频/ MP2T媒体类型）？;
                        
                    
                    
                        
                            此请求已被阻止;内容必须通过HTTPS提供;
                        
                    
                    
                        
                            资源解释为样式表，但转换为MIME类型text / html（似乎与web服务器无关）;
                        
                    
                    
                        
                            通过HTTPS加载页面但请求不安全的XMLHttpRequest端点;
                        
                    
                    
                        
                            拒绝从执行脚本'*'，因为它的MIME类型（“应用/ JSON'）不是可执行文件，并严格MIME类型检查被启用。;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.