分布式计算/Hadoop

过滤弹性搜索结果仅包含基于一个字段值的唯一文档

我的所有文档都有一个 uid 字段,其中的ID将文档链接到用户。有多个文档具有相同的 uid 。 我想对所有只返回/ code>。 选择相关文档的查询是一个简单的 解决方案 你需要一个 top_hits 聚合。 p> 根据您的具体情况: { “查询“:{ ”multi_match“:{ ... } }, ”aggs“:{ ”top-uids“ “条款”:{ ..
发布时间:2017-08-06 22:42:11 分布式计算/Hadoop

如何显示日期名称,在elascticsearch中使用日期直方图聚合

我一直在尝试在弹性搜索中使用日期直方图聚合,并将日期作为纪元或yy-mm-dd-mm-ss格式返回。但是我想要的是每周星期一获得文件数量,星期二等。有没有办法可以做到这一点? 解决方案 你需要采取不同的方法。 使用脚本,您可以将日期时间转换为星期几。 如果您使用术语聚合,则该值将适用。 将日期时间值转换为工作日的脚本 Date date = new Date(doc [' ..
发布时间:2017-08-06 22:41:58 分布式计算/Hadoop

使用Elasticsearch Java API检索特定字段

我正在使用Java API for Elasticsearch。 将实体保存到索引中,可以与完整的源一起检索它们。但是,我只想检索所选的字段,而且这不起作用。 下面的示例代码: SearchResponse response = client.prepareSearch(“my-index”) .setTypes(“my-type”) .setSearchType(Search ..
发布时间:2017-08-06 22:41:45 分布式计算/Hadoop

禁用仅针对弹性搜索的特定索引的动态映射创建?

我试图禁用仅针对特定索引的动态映射创建,而不是全部。由于某种原因,我无法使用'dynamic':'false'放置默认映射。 所以,这里留下两个可以看到的选项: 指定属性'index.mapper.dynamic' / em>在文件 elasticsearch.yml 中。 将'index.mapper.dynamic'在索引创建时间,如下所述 https://www.elastic.c ..
发布时间:2017-08-06 22:41:30 分布式计算/Hadoop

指定在ElasticSearch中索引哪些字段

我有一个文档,我有一些字段,我从来没有查询过,所以我想转换这些字段的索引,以节省资源。我相信我需要禁用 _all 字段,但是如何指定哪些字段被索引? 解决方案 默认情况下,所有字段都在 _all 特殊字段也提供所谓的即时功能盒子外面。但是,您可以通过 include_in_all 选项,为映射中的每个字段指定是否要将其添加到_all字段: “person”:{ “properties ..
发布时间:2017-08-06 22:41:17 分布式计算/Hadoop

如何在弹性搜索中设置标记器

我有一个使用elasticsearch-jetty项目的嵌入式弹性搜索,我需要设置比默认值更好地使用tokenizer。我想使用关键字tokenizer。 我无法弄清楚我通过配置文件如何做到这一点。任何人都可以指出我通过配置文件来做到这一点吗? 除此之外,可以通过对索引执行POST来调整索引,同时启动和运行索引?我真的很想了解如何使用这个,谢谢。 编辑/更新:我无法将curl - ..
发布时间:2017-08-06 22:41:03 分布式计算/Hadoop

在弹性搜索中创建或更新映射

我是Elasticsearch的新手,目前正在努力实施一个 geo_distance 过滤器进行搜索。到目前为止,我的索引具有以下映射(我已经删除了一些字段): { advert_index:{ 映射:{ advert_type:{ 属性:{ __v:{ 类型:“long” }, caption:{ 类型:“string” }, 类别:{ 类型:“string” }, **位 ..
发布时间:2017-08-06 22:40:36 分布式计算/Hadoop

如何明智地结合shingles和edgeNgram来提供灵活的全文搜索?

我们有一个符合OData的API,将其全部搜索需求的一部分委派给Elasticsearch集群。 由于OData表达式可能会变得相当复杂,因此我们决定将它们简单地转换为相同的Lucene查询语法,并将其提供给 query_string 查询。 我们支持一些文本相关的OData过滤器表达式,例如: startswith(field,'bla') endswith(field,'bla ..
发布时间:2017-08-06 22:40:19 分布式计算/Hadoop

ElasticSearch&附件类型(NEST C#)

该文件已编入索引,但搜索结果返回0次匹配。 我需要搜索结果才返回文档ID和高亮结果 (不含base64内容) 这是代码: 我会感谢在这里的任何帮助, 谢谢, class Program { static void Main (string [] args) { //创建客户端 string index =“myindex”; var set ..
发布时间:2017-08-06 22:40:06 分布式计算/Hadoop

弹性搜索过滤文档按字段

我有一些文件: {“name”:“John”,“district”:1}, {“name”:“Mary”,“district”:2}, {“name”:“Nick”,“district”:1}, {“name” ,“区”:3}, {“name”:“肯尼”,“区”:1} 如何按区划过滤/选择不同的文件? {“name”:“John” “区”:1}, {“ ..
发布时间:2017-08-06 22:39:52 分布式计算/Hadoop

弹性搜索:文档中自定义分数字段的影响评分

我有一组通过NLP algos从文本中提取的单词,每个文档中的每个单词都有相关的分数。 例如: 文档1:{“vocab” [{“wtag”:“James Bond”,“rscore”:2.14}, {“wtag”:“world”,“rscore”:0.86}, ...., {“wtag”:“somemore”,“rscore”:3.15} ] } 文档2:{“vocab ..
发布时间:2017-08-06 22:39:39 分布式计算/Hadoop

ElasticSearch&轮胎:使用Mapping和to_indexed_json

在阅读 轮胎 文档时,我的印象是你应该使用映射或 to_indexed_json 方法,因为(我的理解是..)映射用于提供 to_indexed_json 。 问题是,我发现一些使用两个教程。为什么? 基本上,我的应用程序现在使用 to_indexed_json ,但我无法弄清楚如何设置某些属性的增强值(因此我开始关注映射的原因),我想知道如果使用两者会产生一些冲突。 解决方案 ..
发布时间:2017-08-06 22:39:25 分布式计算/Hadoop

弹性搜索按照一个数组的大小进行过滤

如何过滤具有一个数组的字段并具有多个N元素的文档? 如何过滤具有字段的文档?空数组? 是解决方案吗?如果是,那么怎么样? 解决方案 我将看看脚本过滤器。以下过滤器应仅返回 fieldname 字段中至少有10个元素的文档,这是一个数组。请记住,这可能是昂贵的,具体取决于你的索引中有多少文件。 “filter”:{ “script”:{ “script”:“doc ['fi ..
发布时间:2017-08-06 22:39:12 分布式计算/Hadoop

弹性搜索动态脚本禁用

我正在对汇总进行以下查询: aggs:{ total:{ 总和:{ script:“doc ['comments']。value + doc ['likes']。value + doc ['shares']。value” } } } ,并引发以下异常: ScriptException [动态脚本禁用] 任何想法如何解决这个问题。参考: ..
发布时间:2017-08-06 22:38:59 分布式计算/Hadoop

如何使用摄取附件插件在Elasticsearch 5.0.0中编制一个pdf文件?

我是Elasticsearch的新手,我在这里阅读 https:// www .elastic.co / guide / en / elasticsearch / plugins / master / mapper-attachments.html 在弹性搜索5.0.0中不推荐使用mapper-attachments插件。 我现在尝试使用新的摄取附件插件索引pdf文件并上传附件。 我迄 ..

从索引/类型删除所有文档,而不删除类型

我知道可以通过deleteByQuery删除某个类型的所有文档。 示例: curl -XDELETE'http:// localhost:9200 / twitter / tweet / _query'-d'{ “query”:{ “term”:{“user “:”kimchy“} } }' 但是我没有而且只需要删除该类型的所有文档,无论什么条件。实现这一目标的最 ..
发布时间:2017-08-06 22:38:19 分布式计算/Hadoop

弹性搜索地图对not_analyzed文档不敏感

我有一个带有以下映射的类型 PUT / testindex { “mappings”: { “products”:{ “properties”:{ “category_name”:{ “type”:“string”, “index”:“not_analyzed “ } } } } } 我想搜索一个确切的单词。这是为什么我设置为not_analyzed。 ..
发布时间:2017-08-06 22:37:53 分布式计算/Hadoop