elasticsearch-mapping相关内容
我需要自动完成短语.例如,当我搜索“老年痴呆症"时,我想得到“老年痴呆症的痴呆症". 为此,我配置了 Edge NGram tokenizer.我尝试了 edge_ngram_analyzer 和 standard 作为查询正文中的分析器.然而,当我试图匹配一个短语时,我无法得到结果. 我做错了什么? 我的查询: {“询问":{“多匹配":{"query":"老年痴呆症","类
..
如何使用 Elasticsearch Nest API 重新创建以下索引? 这里是包含映射的索引的 json: {“设置":{“分析": {“筛选": {“trigrams_filter":{“类型":“ngram","min_gram": 3,“max_gram":3}},“分析器":{“三元组":{"类型": "自定义","tokenizer": "标准",“筛选": ["小写",
..
我有一些带有名称字段的文档.我使用名称字段的分析版本进行搜索,使用 not_analyzed 进行排序.排序发生在一个级别,即名称首先按字母顺序排序.但是在字母表中,名称是按字典顺序而不是按字母顺序排序的.这是我使用的映射: {“映射":{“看到":{“特性": {“名称": {“类型":“字符串",“领域":{“生的": {“类型":“字符串","index": "not_analyzed"}
..
在我的系统中,数据的插入总是通过logstash通过csv文件完成.我从不预先定义映射.但是每当我输入一个字符串时,它总是被分析,结果像hello I am Sinha 这样的条目被拆分为hello,我、am、Sinha.无论如何,我是否可以更改 elasticsearch 的默认/动态映射,以便所有字符串(无论索引如何)都被不分析?或者有没有办法在 .conf 文件中设置它?假设我的 conf
..
根据pyspark collect_set 或 collect_list with groupby,当你在某列上做一个 collect_list 时,该列中的 null 值会被删除.我已经检查过,这是真的. 但就我而言,我需要保留空列——我怎样才能做到这一点? 我没有找到任何关于这种 collect_list 函数变体的信息. 解释为什么我想要空值的背景上下文: 我有一个数
..
我想知道elasticsearch是否将空字符串视为空值,但是基于下面显示的映射,我看不到它正在这样做.如何让Elasticsearch将空字符串视为 null 并使用 null_value 提供的值进行索引.我的映射如下所示: {“映射":{"my_typee":{“特性": {"autoRank":{"type":“整数","null_value":0,“商店":是的,"index":“已
..
我有一个具有以下映射的字段: 生日:{类型::日期,格式:: dateOptionalTime} 我需要找到每个在5月(包括所有年份)出生的人 另一个查询是查找所有出生于"8月25日"(包括所有年份)的人 查询的内容是什么? 解决方案 您可以通过
..
我正在使用下面的代码,当我键入"cu" 时,它不会自动提示为凝乳 但是它确实与正确的酸奶相匹配.如何获得同义词的自动完成功能和相同的文档匹配功能? PUT产品{“设置":{“索引":{“分析":{“分析器":{"synonym_analyzer":{"tokenizer":“标准",“过滤器":[“小写","synonym_graph"]}},“过滤器":{"synonym_graph":
..
我正在尝试为以下文档进行映射: {"eventDatabase":"abc","usageLibraryEventType":"ABC","name":"Prionti","namespace":"Prionti的名称空间","latestBuildTimestamp":1581348323634,"flattenedEventProperties":[“用户身份"],"eventDefini
..
如何使用AWS上的Elasticsearch更改映射或输入以解决这些错误, 映射: {"index_patterns":["* -students-log"],“映射":{“特性": {“数据": {"type":“对象",“特性": {“通过":{"type":“对象"}}},"insertion_timestamp":{"type":“日期","format":"epoch_seco
..
我的Elastic Search数据库中有一个 created_at 字段,我正在尝试提取数据并按该字段对其进行排序.该字段是使用日期格式的映射属性存储的,其中 fielddata 键设置为 true ,但仍然出现错误: 文本字段并未针对需要按文档的字段数据(例如聚合和排序)的操作进行优化,因此默认情况下将禁用这些操作.请改用关键字字段.或者,在[created_at]上设置fielddat
..
我正在尝试使用带有Logstash的jdbc输入插件将MySQL数据库中的事件集保存到弹性搜索中.数据库中的事件记录包含微秒格式的日期字段.实际上,数据库中有几微秒之间的记录. 在导入数据时,Elasticsearch会将微秒日期格式截断为毫秒格式.如何保存微秒格式的数据?elasticsearch文档说,他们遵循JODA时间API来存储日期格式,该格式不支持微秒,并且在时间戳的末尾添加 Z
..
在我为搜索字段创建的映射下面 PUT/sample/_mapping{“特性": {"webDateTime1":{"type":“日期","format":"dd-MM-yyyy HH:mm:ss || dd-MM-yyyy || hour_minute_second"}}} 如果我基于"04-04-2019 20:17:18"进行搜索以获取正确的数据如果我根据"04-04-2019"进
..
Filebeat正在从文件中读取日志,其中日志的格式如下: {"logTimestamp":"2019-11-29T16:39:43.027Z","@version":"1","message":"Hello world","logger_name":"se.lolotron.App","thread_name":"thread-1","level":"INFO","level_value"
..
无论如何,是否可以在现有的Elasticsearch映射中重命名一个元素而不必添加新元素? 如果是这样,为了避免破坏现有的映射,最好的方法是什么? 例如从fieldCamelcase到fieldCamelCase { “ myType”:{ “ properties”:{ “ ; timestamp“:{ ” type“:” date“, ” format“:” date_opti
..
我需要自动完成短语。例如,当我搜索“阿尔茨海默氏痴呆症” 时,我想获取“阿尔茨海默氏症痴呆症” 。 为此,我配置了 Edge NGram标记程序。我同时尝试了 edge_ngram_analyzer 和 standard 作为查询正文中的分析器。但是,当我尝试匹配短语时却无法获得结果。 我在做什么错了? 我的查询: { “ query”:{ “ multi_match”:
..
在Elasticsearch中存储关系数据的选项有哪些。我知道以下方法 嵌套对象:-我不想将数据存储在嵌套格式,因为我想在不更改另一个文档的情况下更新一个文档,并且如果我使用嵌套对象,那么父文档中的子数据将会重复。 父子数据:-我不想将数据存储在单个索引中,但是为了使用父子数据,数据需要存在于一个索引(不同类型)中。我知道此限制将在 https://github.com/elastic
..
将type声明为string时,Elasticsearch 6.0将显示此错误. "name" => [ "type" => "string", "analyzer" => "ik_max_word" ] 解决方案 Elasticsearch删除了string类型,现在正在使用text.所以你的代码应该是这样的 "name" => [ "type" => "text"
..
根据但就我而言,我需要保留null列-如何实现此目的? 我没有找到有关collect_list函数这种变体的任何信息. 背景信息来解释为什么我想要空值: 我有一个数据框df,如下所示: cId | eId | amount | city 1 | 2 | 20.0 | Paris 1 | 2 | 30.0 |
..
我有几个文件,其中有一个名称字段。我正在使用搜索的名称字段的分析版本和 not_analyzed 进行排序。排序发生在一个级别,即名称首先按字母顺序排列。但是在字母表的列表中,这些名称按字典顺序排列,而不是按字母顺序排列。 这是我使用的映射: { “mappings”:{ “seing”:{ “properties”:{ “name”:{ “type”:“string”, “field
..