fuzzy相关内容

django模糊字符串翻译没有出现

为什么有时我会在 django.po 语言文件中得到一个 fuzzy 项.实际上,我已经在我的项目中检查了 fuzzy 字符串项是完全唯一的. #: .\users\views.py:81 .\users\views.py:101#,模糊msgstr "用户名或电子邮件"msgstr "9988" 模糊是可以的,但我翻译的模糊项目没有显示在页面上,只有英文版本显示.太奇怪了. 解决方案 ..
发布时间:2022-01-18 13:42:13 其他开发

DAX 最接近的值匹配,没有关系

我正在尝试将报表从 Excel 迁移到 Power BI,我希望有人可以帮助我,因为我是 DAX 新手. 我有两张表,一张(我们称之为表 A)包含一列计划的事件开始日期/时间,而另一个包含相同事件的实际开始日期/时间.计划开始时间和实际开始时间之间通常只有几分钟的差异. 我需要将表 B 中最接近的实际开始日期/时间与表 A 中计划的开始日期/时间相匹配. 没有可用于在两个表之间创 ..
发布时间:2022-01-10 17:04:37 其他开发

在不到指数的时间内进行模糊匹配重复数据删除?

我有一个大型数据库(可能有数百万条记录),其中包含相对较短的文本字符串(按街道地址、名称等顺序). 我正在寻找一种去除不精确重复的策略,模糊匹配似乎是首选方法.我的问题:许多文章和 SO 问题都涉及将单个字符串与数据库中的所有记录进行匹配.我希望立即对整个数据库进行重复数据删除. 前者将是一个线性时间问题(将一个值与一百万个其他值进行比较,每次都计算一些相似性度量).后者是指数时间问题 ..

在 Unicode 中查找相似的 ASCII 字符

有人知道在 Unicode 中查找与 ASCII 字符相似的字符的简单方法吗?一个例子是“西里尔小写字母 DZE (S)".我想搜索并替换相似的字符.类似的意思是人类可读的.光看是看不出区别的. 解决方案 正如其他评论者所指出的,Unicode 规范化(“兼容性字符")在这里不会帮助你,因为你不是在寻找官方的等价物,而是在寻找字形(字母形状)的相似性.(链接的 Unicode 技术报告仍然 ..
发布时间:2021-12-25 09:20:11 其他开发

Python模糊字符串匹配作为相关样式表/矩阵

我有一个包含 x 个字符串名称及其关联 ID 的文件.基本上是两列数据. 我想要的是一个格式为 x x x 的相关样式表(将相关数据同时作为 x 轴和 y 轴),但我想要模糊模糊库的函数模糊,而不是相关性.ratio(x,y) 作为使用字符串名称作为输入的输出.基本上针对每个条目运行每个条目. 这就是我的想法.只是为了表明我的意图: 将pandas导入为pd从fuzzywuzzy导入 ..
发布时间:2021-06-13 20:43:55 Python

如何在python中将数字单词转换为数字

我想把用文字表示的数字转换成数字. 例如,三万四千四五十转化为对应的数值34450.还有一些模糊的转换,比如“请支付三万四千四五十美元",然后输出为34450. 解决方案 对于数字到单词,尝试“num2words"包:https://pypi.python.org/pypi/num2words 对于要num的单词,我从此处的代码中稍微调整了代码:有没有办法将数字转换为整数? ..
发布时间:2021-06-07 20:42:12 Python

如何用SPSS模糊命令修复案例控制匹配

我正在尝试在数据中创建1:4案例对照匹配,但最终数据集不包含任何控件.为什么呢? 我正在使用SPSS 23进行745,414观察,595,388对照和150026例(1:4比率为20.1%).这些病例和对照已经按照年龄和性别进行匹配,但是我正在尝试创建五个观察值的集群(1个病例和4个对照),每个观察值都标有特定的ID. 这是我一直在使用的代码: FUZZY BY =年龄性别Sup ..
发布时间:2021-05-31 20:24:03 其他开发

模糊匹配两个字符串

我有两个向量,每个向量都包含一系列字符串.例如 V1 = c("pen","document folder","warn")V2 = c(“笔",“复制文件夹",“警告") 我需要找到最匹配的两个.我直接使用levenshtein距离.但这还不够好.就我而言,一支笔和一支笔应具有相同的含义.文档文件夹和复制文件夹可能是一回事.警告和警告实际上是相同的.我正在尝试使用tm之类的软件包.但是我 ..
发布时间:2021-05-31 20:23:10 其他开发

stringdist_join的结果为NA

我正在试验stringdist软件包以进行模糊连接,但遇到了一个我不理解且无法找到答案的问题. 我想用"dl"方法将这两个数据表连接起来,并产生一个NA,我完全不了解.也许你们中的一个对此有一个解释. 代码: library(fuzzyjoin) test1 ..
发布时间:2020-06-24 18:36:35 其他开发

Google表格-匹配的公司名称

我有2个数据库,都有公司名称,但格式不同.我已经能够使用vlookup进行精确匹配.我想提取写不同的公司,但实际上它们是同一家公司,并提取数据. 下面是我拥有的数据库的一小部分 Database 1 Column A 1-800-Flowers.com Inc Abbott Laboratories (Abbott) 21st Century Fox America Inc (for ..
发布时间:2020-06-15 19:28:47 其他开发

使用python将近似字符串匹配从excel复制到另一个excel文件

嗨,我想问一下如何将某些行从一个Excel文件复制到另一个Excel文件.通过使用python模糊匹配方法或 ANY 其他可行的方法,希望根据名称将整个行进行匹配并复制到新的excel文件中. 这是第一个excel文件的输入数据,共有13行6列,如下所示: -----------------------------------------------------|-----|----- ..
发布时间:2020-06-15 19:28:44 Python

在Unicode中查找类似的ASCII字符

有人知道一种简单的方法来查找与ASCII字符相似的Unicode字符.例如"西里尔小写字母DZE (s)" .我想进行搜索并替换类似的字符.类似地,我的意思是人类可读.看不到差异. 解决方案 正如其他评论者所指出的, Unicode归一化(“兼容性字符")不会在这里为您提供帮助,因为您不是在寻找正式的对等物,而是在字形(字母形状)中寻找相似之处. (尽管链接的Unicode技术报告写得非常 ..
发布时间:2020-06-15 19:28:42 其他开发

Python中的模糊智能数解析

我希望解析十进制数字,而不管它们的格式如何,这是未知的.原始语言是未知的,可能会有所不同.另外,源字符串可以在前后包含一些额外的文本,例如货币或单位. 我正在使用以下内容: # NOTE: Do not use, this algorithm is buggy. See below. def extractnumber(value): if (isinstance(value ..
发布时间:2020-05-25 01:20:28 Python

Clang用于模糊解析C ++

是否可以使用现有的libclang API解析带有不完整声明的C ++? IE.解析.cpp文件而不包含所有标头,从而动态推断出声明.因此,例如以下文字: A B::Foo(){return stuff();} 将检测未知符号A,使用我的魔术启发式方法调用我的回调(扣除A的类),然后使用B和Foo及其他方法以相同的方式调用此回调.最后,我希望能够推断出我看到B类的成员Foo返回了A,而东 ..
发布时间:2020-05-25 01:02:17 C/C++开发

Excel数据的模糊逻辑-Pandas

我有两个数据帧DF(〜100k行),这是一个原始数据文件,还有DF1(15k行),映射文件.我正在尝试将DF.address和DF.Name列匹配到DF1.Address和DF1.Name.找到匹配项后,应在DF.ID中填充DF1.ID(如果DF1.ID不为None),否则应在DF.ID中填充DF1.top_ID. 我能够借助模糊逻辑来匹配地址和名称,但是我仍然坚持如何连接获得的结果以填充I ..
发布时间:2020-05-24 03:01:00 Python

DAX最接近的值匹配,没有任何关系

我正在尝试将报告从Excel迁移到Power BI,希望当我不熟悉DAX时有人可以帮助我. 我有两个表,一个(称为表A)包含一列事件的计划开始日期/时间,而另一个包含相同事件的实际开始日期/时间.计划的开始时间与实际的开始时间通常只有几分钟的时间. 我需要将表B中最接近的实际开始日期/时间与表A中计划的开始日期/时间进行匹配. 没有可用的列来创建两个表之间的关系. 如果我可 ..
发布时间:2020-05-06 09:33:55 其他开发

图像上的模糊数学形态

我需要在图像上应用模糊数学形态学的指南. 模糊数学形态学使用模糊集理论的概念.我正在尝试探索图像处理中的模糊MM方法.模糊集的值应解释为隶属度而不是像素值. 模糊图像处理分为三个主要阶段:图像模糊化,隶属值修改和图像去模糊化. 参考文献:图像处理中的模糊数学形态学方法 模糊化和反模糊化步骤是由于我们没有模糊硬件而导致的.因此,图像数据的编码(模糊化)和结果的解码(模糊化)是使得可以 ..
发布时间:2019-06-19 22:02:38 其他开发语言