html-parsing - IT屋-程序员软件开发技术分享社区

美丽的汤元内容标签

我必须得到‘4103海滩断崖路’的内容。我正在尝试使用BeautifulSoup完成此操作，因此，我尝试执行以下操作： soup = BeautifulSoup(' ..

发布时间：2022-07-01 20:30:00 python html beautifulsoup html-parsing 前端开发

如何检测Anglesharp中DOM元素的变化

我正在使用Anglesharp解析网站--一切正常但有些信息只有在单击页面上的元素后才会显示，而且是动态发生的在浏览器中，我可以看到这些更改，但在解析时，Anglesharp无法加载DOM元素更改如何使用Anglesharp检测更改并分析新元素中的数据？推荐答案您不能。这些更改是由Java脚本创建的，并且在从Web服务器发送您的原始源代码中不存在。Anglesharp或HTM ..

发布时间：2022-04-18 23:28:49 c# html-parsing html-agility-pack html-parser anglesharp C#/.NET

浏览器向上拆分<；p>；和包含嵌套<；p>；块的嵌套<；代码>；块。为什么？

您可以在this jsFiddle中查看我的问题。我尝试使用code标记来区分特殊内容，但这很快就适得其反(正如您在上面的链接中看到的那样)。当我使用Firebug查看内容时，如下所示： This is a sample paragraph with a code block: Some line of code ..

发布时间：2022-03-22 14:12:18 html browser html-parsing 前端开发

使用BeautifulSoup处理前标记中的尖括号

我有一个这样的字符串 html = " City__001 " 尝试使用BeautifulSoup 4解析时，使用以下代码 >>> from bs4 import BeautifulSoup >>> html = " City__001 " >>> soup = BeautifulSoup(html, "h ..

发布时间：2022-03-22 14:10:52 python python-3.x beautifulsoup html-parsing Python

为什么lxml在解析时关闭这个&q；ol&q；标记？

以下是一些HTML： item 和一些使用lxml的python 3代码解析并重新打印： import sys from lxml import etree, html document_root = html.fromstring(sys.stdin.read()) print(etree.tostring(document ..

发布时间：2022-03-22 14:07:06 html-parsing lxml 其他开发

BeautifulSoup-从JS中提取特定的JSON键值

我正在处理BeautilfulSoup，并且正在寻找一种在JS元素中获取特定json字符串的方法。这里是JS： window.pinball = window.pinball || []; window.pinball.push(['add', {"srp_cleanup":"inactive","book_visit":"inactive","my_visits": ..

发布时间：2022-02-21 14:48:39 python html json beautifulsoup html-parsing 前端开发

如何使用 php 从 html 中提取 img src、title 和 alt?

我想创建一个页面，其中列出了我网站上的所有图像以及标题和替代表示. 我已经写了一个小程序来查找和加载所有 HTML 文件，但现在我被困在如何提取 src、title 和 alt 来自这个 HTML: 我想这应该用一些正则表达式来完 ..

发布时间：2022-01-30 11:31:28 php html regex html-parsing html-content-extraction PHP

如何在 VB6 中使用 MSHTML Parser 去除所有 HTML 标签?

如何在 VB6 中使用 MSHTML Parser 去除所有 HTML 标签? 解决方案这是改编自 CodeGuru 的 Code over.非常感谢原作者:http://www.codeguru.com/vb/vb_internet/html/article.php/c4815 如果您需要从网络下载 HTML，请查看原始来源.例如: 设置 objDocument = objMS ..

发布时间：2022-01-20 19:30:41 vb6 html-parsing mshtml 其他开发

MSHTML:CreateDocumentFromString 而不是 CreateDocumentFromUrl

我想使用 MSHTML 库来解析字符串变量中的一些 HTML.但是，我无法弄清楚如何做到这一点.我可以轻松地解析给定 URL 的网页内容，但不能直接解析源 HTML.这可能吗?如果有，怎么做? Public Sub ParseHTML(sHTML As String)Dim oHTML As New HTMLDocument, oDoc As HTMLDocument'这有效:'设置 oDoc ..

发布时间：2022-01-20 18:47:48 vba vb6 html-parsing mshtml 其他开发

HTML Agility Pack 条带标签不在白名单中

我正在尝试创建一个函数来删除不在白名单中的 html 标记和属性.我有以下 HTML: 第一个文本这里有第二个文字这里有一些文字这里有一些文字这里有一些东西我正在使用 HTML 敏捷包，目前我的代码是: 静态列表WhiteNodeList = 新列表{“乙"};静态列表WhiteAttrList = ..

发布时间：2022-01-18 20:54:10 c# tags html-parsing html-agility-pack sanitize C#/.NET

在 C# 中使用 Html 敏捷性解析表格、单元格

我需要解析 Html 代码.更具体地说，解析所有表中每一行的每个单元格.每行代表一个对象，每个单元格代表不同的属性.我想解析这些以便能够编写一个包含每个数据的 XML 文件(没有无用的 HTML 代码).我已经成功地解析了 HTML 文件中的每一列，但现在我不知道将其写入 XML 文件的选项是什么.我很困惑. HTML: ..

发布时间：2022-01-10 20:04:59 c# html-agility-pack xml-parsing html-parsing C#/.NET

xpath 查找不包含子节点的节点

我正在尝试创建一些 xpath，它将找到所有不包含 img 标记的 a 标记，以便诸如链接匹配，但是没有. 当然，我可以通过两部分搜索来做到这一点，但我确信一定有某种方法可以用 xpa ..

发布时间：2022-01-10 19:46:45 xpath html-parsing xml-parsing 其他开发

“findAll"之间的区别和“find_all"在美丽汤

我想用 Python 解析一个 HTML 文件，我使用的模块是 BeautifulSoup. 据说函数find_all和findAll是一样的.我都试过了，但我相信它们是不同的: 导入urllib、urllib2、cookielib从 BeautifulSoup 进口 *网站 = "http://share.dmhy.org/topics/list?keyword=TARI+TARI+te ..

发布时间：2022-01-10 19:37:38 python xml-parsing html-parsing beautifulsoup Python

DOM文档在php中

我刚刚开始阅读有关 DOM 的文档和示例，以便抓取和解析文档. 例如，我有部分文档如下所示: 废话 ..

发布时间：2022-01-10 19:36:50 php xml-parsing html-parsing domdocument PHP

您如何在 PHP 中解析和处理 HTML/XML?

如何解析 HTML/XML 并从中提取信息? 解决方案 Native XML Extensions 我更喜欢使用原生 XML 扩展，因为它们与PHP，通常比所有 3rd 方库都快，并为我提供对标记的所有控制. DOM DOM 扩展允许您使用 PHP 5 通过 DOM API 对 XML 文档进行操作.它是 W3C 文档对象模型核心级别 3 的实现，一个平台和语言中立的接 ..

发布时间：2022-01-10 19:35:11 php html xml xml-parsing html-parsing PHP

在 Python 中进行类似 jquery 的 HTML 解析?

是否有任何 Python 库可以让我解析类似于 jQuery 的 HTML 文档? 即我希望能够使用 CSS 选择器语法从文档中抓取任意一组节点，读取它们的内容/属性等. 我以前使用过的唯一 Python HTML 解析库是 BeautifulSoup，尽管它很好，但我一直认为如果我有可用的 jQuery 语法，我的解析会更快.:D 解决方案如果你精通BeautifulSo ..

发布时间：2022-01-10 08:08:24 python jquery css-selectors html-parsing Python

如何从 ColdFusion 字符串中清除 HTML 标签?

我正在寻找一种从 ColdFusion 字符串中解析 HTML 标记的快速方法.我们正在提取一个 RSS 提要，其中可能包含任何内容.然后我们对信息进行一些操作，然后将其吐回另一个地方.目前我们正在使用正则表达式来执行此操作.有没有更好的方法来做到这一点? ..

发布时间：2022-01-09 15:18:29 regex coldfusion rss html-parsing coldfusion-8 其他开发

在 Android 上使用 TextView 和 Html.ImageGetter 异步显示图像?

我想用 SpannableString 设置一个 TextView，它来自以下方法: Html.fromHtml(String source, Html.ImageGetter imageGetter,Html.TagHandler tagHandler) 但是这里的ImageGetter需要覆盖下面的方法: public abstract Drawable getDrawable(Stri ..

发布时间：2022-01-09 14:22:38 android textview android-asynctask html-parsing 移动开发

Android ImageGetter 图像重叠文本

我正在尝试使用将 HTML 块加载到 TextView 中，包括图像 URLImageParser p = new URLImageParser(articleBody, this);跨越 htmlSpan = Html.fromHtml(parsedString, p, null); 顺便说一下， parsedString 是 HTML.无论如何，它会加载，但是图像没有为它们创建任何空 ..

发布时间：2022-01-09 13:38:05 android textview html-parsing spanned 移动开发

使用 TextView 和 Html.ImageGetter 在 Android 上异步显示图像?

我想使用以下方法中的 SpannableString 设置 TextView: Html.fromHtml(String source, Html.ImageGetter imageGetter,Html.TagHandler tagHandler) 但是这里的ImageGetter需要重写下面的方法: public abstract Drawable getDrawable(String ..

发布时间：2022-01-07 22:30:15 android textview android-asynctask html-parsing 移动开发

html-parsing相关内容