parsing相关内容

在 C 中解析二进制数据?

是否有任何关于如何在 C 中读取和解析二进制数据的库或指南? 我正在研究一些功能,它将在网络套接字上接收 TCP 数据包,然后根据规范解析二进制数据,通过代码将信息转换为更可用的形式. 是否有任何库可以做到这一点,或者甚至是执行此类事情的入门书? 解决方案 在 C/C++ 中执行此操作的标准方法实际上是按照“gwaredd"的建议强制转换为结构 它并不像人们想象的那样不安 ..
发布时间:2022-01-19 16:06:59 其他开发

在 PHP、大型 switch 语句或每次都支付数组初始化费用的数组键查找中,什么更快?

在 PHP 中,做一个大的 switch 语句,或者设置一个数组并查找 key 哪个更快? 现在在你回答之前,我很清楚对于纯查找,数组更快.但是,这是假设只创建一次数组,然后重复查找. 但这不是我正在做的 - 每次运行代码都是新的,并且数组将每次只使用一次.所以所有的数组哈希每次都需要重新计算,我想知道这样做是否比简单地使用 switch 语句要慢. 解决方案 我做了一些测试: ..
发布时间:2022-01-19 10:39:00 PHP

解析正负整数的字符串,Javascript

所以我正在研究一个用 d3 制作的标签云示例. http://www.jasondavies.com/wordcloud/#http%3A%2F%2Fsearch.twitter.com%2Fsearch.json%3Frpp%3D100%26q%3D%7Bword%7D=cloud 并且我试图在每个单词悬停时将 Div 放置在它的顶部,并且基本上遇到了问题,因为我放置 div 的方式 ..
发布时间:2022-01-18 21:40:10 前端开发

解析两个 XML 标记之间的值

我知道以前有人问过这个问题,但是我似乎找不到合适的解决方案,所以我将说明问题: 我有一个类似于 XML 文件的字符串.它不是 XML 字符串,但它具有开始和结束标记.所有信息都在一行中,例如: username随机数据;一些更多随机数据datarandomdata;myinfo ..
发布时间:2022-01-18 21:40:02 服务器开发

如何在 PHP 中只获取 a p 标签的 alt 属性?

我正在编写一个只回显价格的脚本.如果我这样做: $alttag = $oNode['p'];回声 $alttag; 它将回显 中的所有内容.所以它会回显: cafeïnevrij 的路德默克每包 500 克 2 巴肯 prijs 每公斤 1,99 199 从网站上,所以你可以看到它是 199,这是价格,但首先我只需要 中的 199 ..
发布时间:2022-01-18 21:37:19 PHP

如何实现词性 (POS) 标注器

我正在寻找基于 PHP 的最佳方式来扫描大量文本条目(分类广告)并提取关键字 - 有人知道词性标记吗?有没有类似 PHP 的方法来做到这一点? 我扫描了很多在线分类广告 - 但没有一个分类!为了加快分类过程,我希望安装一个词性标注器 (http://en.wikipedia.org/wiki/Part-of-speech_tagging).基本上,这些是很酷的文本解析算法软件包,可以告诉我哪 ..
发布时间:2022-01-18 21:30:18 PHP

带有Matlab的html标签的正则表达式

我正在寻找一种使用正则表达式的方法,以便从字符串中删除所有 html 标记. 所以如果我有 Hello 我想从中获取 hello. 我知道它可能看起来像嵌套标签,但实际上并非如此,因为我在这里要做的就是删除两个 之间的任何内容. 我正在使用 Matlab 来执行此操作,但 ..
发布时间:2022-01-18 21:19:25 其他开发

在 Python 中使用斯坦福正则表达式

我是 NLP 和 Python 的新手.我正在尝试使用 Tregex 工具和 Python 子进程库从来自 StanfordCoreNLP 的解析树中提取名词短语的子集.特别是,我正在尝试查找和提取与以下模式匹配的名词短语:'(NP[$VP]>S)|(NP[$VP]>S\n)|(NP\n[$VP]>S)|(NP\n[$VP]>S\n)' 在 Tregex 语法中. 例如,下面是原始文本,保存 ..
发布时间:2022-01-18 15:59:00 Python

从专有名称中提取通用名称

.NET 中是否有从 rfc-2253 编码的专有名称解析 CN 的调用?我知道有一些第三方库可以做到这一点,但如果可能的话,我更愿意使用本机 .NET 库. 字符串编码的DN示例 CN=L.Eagle,O=Sue\, Grabbit and Runn,C=GB CN=Jeff Smith,OU=Sales,DC=Fabrikam,DC=COM 解决方案 如果您使用的是 ..
发布时间:2022-01-17 19:19:56 C#/.NET

用于解析发现退回邮件的 SMTP 日志的工具

我们的网络应用程序发送电子邮件.我们有很多用户,我们收到很多反弹.例如,用户更换公司,他的公司电子邮件不再有效. 为了查找退回邮件,我使用日志解析器解析 SMTP 日志文件.日志来自 Microsoft SMTP 服务器. 有些反弹很棒,例如 550+#5.1.0+Address+rejected+user@domain.com.弹跳中有user@domain.com. 但有些错 ..
发布时间:2022-01-17 15:12:47 其他开发

是否有任何 JavaScript 标准 API 可以根据语言环境解析为数字?

对于根据区域设置格式化数字,有一个标准的 JavaScript API:Intl.NumberFormat 但是对于反向操作,将字符串解析为数字我找不到任何支持语言环境的标准 API: Number 不支持任何语言环境论据. parseFloat 和 parseInt 也不支持任何语言环境参数. 真的没有 JavaScript 标准 API 可以根据语言环境将字符串解析为数字吗 ..
发布时间:2022-01-17 10:00:39 前端开发

检测字符串是否为数字的最优雅方法?

有没有比 更好、更优雅(和/或可能更快)的方法 boolean isNumber = false;尝试{Double.valueOf(myNumber);isNumber = true;} 捕捉(NumberFormatException e){} ...? 编辑:由于我无法选择两个答案,我将使用正则表达式一个,因为 a) 它很优雅 b) 说“Jon Skeet 解决了问题"是重言式, ..
发布时间:2022-01-17 09:58:13 Java开发

从字符串中解析多个双精度数

我想知道如何从一个字符串中解析几个双数,但是字符串可以混合,例如:String s = "text 3.454 sometext5.567568more_text". 标准方法(Double.parseDouble)不合适.我尝试使用 isDigit 方法解析它,但是如何解析其他字符和 .? 谢谢. 解决方案 在使用此代码或其他帖子中的合适正则表达式解析双打后,迭代以将匹配的双 ..
发布时间:2022-01-17 09:50:06 Java开发

如何从字符串中取出数字?

我正在使用 Java StreamTokenizer 来提取字符串的各种单词和数字,但遇到了一个问题,其中涉及包含逗号的数字,例如10,567 被读取为 10.0 和 ,567. 我还需要从可能出现的数字中删除所有非数字字符,例如$678.00 应该是 678.00 或 -87 应该是 87. 我相信这些可以通过 whiteSpace 和 wordChars 方法来实现,但是有人知道怎 ..
发布时间:2022-01-17 09:47:22 Java开发

如何在 C# 中制作通用数字解析器?

要将字符串解析为 int,调用 Int32.Parse(string),对于 double,Double.Parse(string),对于 long,Int64.Parse(string) 等等.. 是否可以创建一个使其通用的方法,例如 ParseString(string)?其中 T 可以是 Int32、Double 等.我注意到类型的数量没有实现任何通用接口,而 Parse 方法没 ..
发布时间:2022-01-17 09:46:35 C#/.NET

在 Perl 中将字符串中的十六进制数转换为负数

我在由 Perl 脚本解析的日志文件中有一堆数字表示为十六进制字符串,而我对 Perl 相对缺乏经验. 其中一些数字实际上是有符号负数,即 0xFFFE == -2 当表示为 16 位有符号整数时. 谁能告诉我从 Perl 中的字符串 FFFE 中获取该数字的签名表示的规范方法,或者以其他方式为我提供教程或其他资源? 解决方案 你可以使用 hex() 函数将十六进制转换为十进制 ..
发布时间:2022-01-17 09:40:30 其他开发

json_decode AND json_encode 长整数而不丢失数据

如 PHP 文档中所述,当 json_decode 处理包含长整数的数据结构时,它们将被转换为浮点数.解决方法是使用 JSON_BIGINT_AS_STRING,将它们保留为字符串.当 json_encode 输入这些值时,JSON_NUMERIC_CHECK 会将这些数字编码回大整数: $json = '{"foo":283675428357628352}';$obj = json_decod ..
发布时间:2022-01-17 09:24:48 PHP

解析上下文相关语言

我正在阅读 Terence Parr 的 Definitive ANTLR reference,他说: 语义谓词是一个强大的识别上下文相关的方法通过允许语言结构要驱动的运行时信息识别 但是书中的例子很简单.我需要知道的是:ANTLR 可以解析 context-sensitive 规则,例如: xAy --> xBy 如果 ANTLR 无法解析这些规则,是否还有其他工具可以处 ..