elasticsearch-mapping相关内容

带短语匹配的 Edge NGram

我需要自动完成短语.例如,当我搜索“老年痴呆症"时,我想得到“老年痴呆症的痴呆症". 为此,我配置了 Edge NGram tokenizer.我尝试了 edge_ngram_analyzer 和 standard 作为查询正文中的分析器.然而,当我试图匹配一个短语时,我无法得到结果. 我做错了什么? 我的查询: {“询问":{“多匹配":{"query":"老年痴呆症","类 ..

在elasticsearch中未按字母顺序排序的字段

我有一些带有名称字段的文档.我使用名称字段的分析版本进行搜索,使用 not_analyzed 进行排序.排序发生在一个级别,即名称首先按字母顺序排序.但是在字母表中,名称是按字典顺序而不是按字母顺序排序的.这是我使用的映射: {“映射":{“看到":{“特性": {“名称": {“类型":“字符串",“领域":{“生的": {“类型":“字符串","index": "not_analyzed"} ..
发布时间:2021-12-13 11:45:11 其他开发

将字符串的默认映射更改为“未分析"在 Elasticsearch 中

在我的系统中,数据的插入总是通过logstash通过csv文件完成.我从不预先定义映射.但是每当我输入一个字符串时,它总是被分析,结果像hello I am Sinha 这样的条目被拆分为hello,我、am、Sinha.无论如何,我是否可以更改 elasticsearch 的默认/动态映射,以便所有字符串(无论索引如何)都被不分析?或者有没有办法在 .conf 文件中设置它?假设我的 conf ..

Pypsark - 使用 collect_list 时保留空值

根据pyspark collect_set 或 collect_list with groupby,当你在某列上做一个 collect_list 时,该列中的 null 值会被删除.我已经检查过,这是真的. 但就我而言,我需要保留空列——我怎样才能做到这一点? 我没有找到任何关于这种 collect_list 函数变体的信息. 解释为什么我想要空值的背景上下文: 我有一个数 ..

elasticsearch是否将空字符串视为null?

我想知道elasticsearch是否将空字符串视为空值,但是基于下面显示的映射,我看不到它正在这样做.如何让Elasticsearch将空字符串视为 null 并使用 null_value 提供的值进行索引.我的映射如下所示: {“映射":{"my_typee":{“特性": {"autoRank":{"type":“整数","null_value":0,“商店":是的,"index":“已 ..
发布时间:2021-05-03 20:41:37 其他开发

如何在Elasticsearch中获得同义词匹配的自动建议

我正在使用下面的代码,当我键入"cu" 时,它不会自动提示为凝乳 但是它确实与正确的酸奶相匹配.如何获得同义词的自动完成功能和相同的文档匹配功能? PUT产品{“设置":{“索引":{“分析":{“分析器":{"synonym_analyzer":{"tokenizer":“标准",“过滤器":[“小写","synonym_graph"]}},“过滤器":{"synonym_graph": ..

Elasticsearch对象映射,试图将字段[null]解析为对象,但发现了具体值

如何使用AWS上的Elasticsearch更改映射或输入以解决这些错误, 映射: {"index_patterns":["* -students-log"],“映射":{“特性": {“数据": {"type":“对象",“特性": {“通过":{"type":“对象"}}},"insertion_timestamp":{"type":“日期","format":"epoch_seco ..

Elasticsearch按自定义created_at字段排序

我的Elastic Search数据库中有一个 created_at 字段,我正在尝试提取数据并按该字段对其进行排序.该字段是使用日期格式的映射属性存储的,其中 fielddata 键设置为 true ,但仍然出现错误: 文本字段并未针对需要按文档的字段数据(例如聚合和排序)的操作进行优化,因此默认情况下将禁用这些操作.请改用关键字字段.或者,在[created_at]上设置fielddat ..

在ElasticSearch中以微秒格式保存日期

我正在尝试使用带有Logstash的jdbc输入插件将MySQL数据库中的事件集保存到弹性搜索中.数据库中的事件记录包含微秒格式的日期字段.实际上,数据库中有几微秒之间的记录. 在导入数据时,Elasticsearch会将微秒日期格式截断为毫秒格式.如何保存微秒格式的数据?elasticsearch文档说,他们遵循JODA时间API来存储日期格式,该格式不支持微秒,并且在时间戳的末尾添加 Z ..

Elasticsearch映射-重命名现有字段

无论如何,是否可以在现有的Elasticsearch映射中重命名一个元素而不必添加新元素? 如果是这样,为了避免破坏现有的映射,最好的方法是什么? 例如从fieldCamelcase到fieldCamelCase { “ myType”:{ “ properties”:{ “ ; timestamp“:{ ” type“:” date“, ” format“:” date_opti ..
发布时间:2020-10-28 02:07:47 其他开发

具有词组匹配功能的Edge NGram

我需要自动完成短语。例如,当我搜索“阿尔茨海默氏痴呆症” 时,我想获取“阿尔茨海默氏症痴呆症” 。 为此,我配置了 Edge NGram标记程序。我同时尝试了 edge_ngram_analyzer 和 standard 作为查询正文中的分析器。但是,当我尝试匹配短语时却无法获得结果。 我在做什么错了? 我的查询: { “ query”:{ “ multi_match”: ..

如何在Elasticsearch中存储关系数据

在Elasticsearch中存储关系数据的选项有哪些。我知道以下方法 嵌套对象:-我不想将数据存储在嵌套格式,因为我想在不更改另一个文档的情况下更新一个文档,并且如果我使用嵌套对象,那么父文档中的子数据将会重复。 父子数据:-我不想将数据存储在单个索引中,但是为了使用父子数据,数据需要存在于一个索引(不同类型)中。我知道此限制将在 https://github.com/elastic ..
发布时间:2020-10-28 01:26:19 其他开发

字段没有按字母顺序排列在弹性搜索中

我有几个文件,其中有一个名称字段。我正在使用搜索的名称字段的分析版本和 not_analyzed 进行排序。排序发生在一个级别,即名称首先按字母顺序排列。但是在字母表的列表中,这些名称按字典顺序排列,而不是按字母顺序排列。 这是我使用的映射: { “mappings”:{ “seing”:{ “properties”:{ “name”:{ “type”:“string”, “field ..
发布时间:2017-08-07 05:07:28 分布式计算/Hadoop