分布式计算/Hadoop 第145页 - IT屋-程序员软件开发技术分享社区

如何在弹性搜索中更新与查询匹配的多个文档

首先我有仅包含“url”（分析）和“respsize”（not_analyzed）字段的文档。我想要更新匹配url的文档，并添加新的字段“category” 我的意思是 at first doc1： { “url”：“http://stackoverflow.com/用户/ 4005632 / mehmet-yener-yilmaz“， ”respsize“：”500“ } ..

发布时间：2017-08-06 22:42:24 elasticsearch 分布式计算/Hadoop

过滤弹性搜索结果仅包含基于一个字段值的唯一文档

我的所有文档都有一个 uid 字段，其中的ID将文档链接到用户。有多个文档具有相同的 uid 。我想对所有只返回/ code>。选择相关文档的查询是一个简单的解决方案你需要一个 top_hits 聚合。 p> 根据您的具体情况： { “查询“：{ ”multi_match“：{ ... } }， ”aggs“：{ ”top-uids“ “条款”：{ ..

发布时间：2017-08-06 22:42:11 elasticsearch 分布式计算/Hadoop

如何显示日期名称，在elascticsearch中使用日期直方图聚合

我一直在尝试在弹性搜索中使用日期直方图聚合，并将日期作为纪元或yy-mm-dd-mm-ss格式返回。但是我想要的是每周星期一获得文件数量，星期二等。有没有办法可以做到这一点？解决方案你需要采取不同的方法。使用脚本，您可以将日期时间转换为星期几。如果您使用术语聚合，则该值将适用。将日期时间值转换为工作日的脚本 Date date = new Date（doc [' ..

发布时间：2017-08-06 22:41:58 elasticsearch 分布式计算/Hadoop

使用Elasticsearch Java API检索特定字段

我正在使用Java API for Elasticsearch。将实体保存到索引中，可以与完整的源一起检索它们。但是，我只想检索所选的字段，而且这不起作用。下面的示例代码： SearchResponse response = client.prepareSearch（“my-index”） .setTypes（“my-type”） .setSearchType（Search ..

发布时间：2017-08-06 22:41:45 elasticsearch 分布式计算/Hadoop

禁用仅针对弹性搜索的特定索引的动态映射创建？

我试图禁用仅针对特定索引的动态映射创建，而不是全部。由于某种原因，我无法使用'dynamic'：'false'放置默认映射。所以，这里留下两个可以看到的选项：指定属性'index.mapper.dynamic' / em>在文件 elasticsearch.yml 中。将'index.mapper.dynamic'在索引创建时间，如下所述 https://www.elastic.c ..

发布时间：2017-08-06 22:41:30 elasticsearch 分布式计算/Hadoop

指定在ElasticSearch中索引哪些字段

我有一个文档，我有一些字段，我从来没有查询过，所以我想转换这些字段的索引，以节省资源。我相信我需要禁用 _all 字段，但是如何指定哪些字段被索引？解决方案默认情况下，所有字段都在 _all 特殊字段也提供所谓的即时功能盒子外面。但是，您可以通过 include_in_all 选项，为映射中的每个字段指定是否要将其添加到_all字段： “person”：{ “properties ..

发布时间：2017-08-06 22:41:17 elasticsearch 分布式计算/Hadoop

如何在弹性搜索中设置标记器

我有一个使用elasticsearch-jetty项目的嵌入式弹性搜索，我需要设置比默认值更好地使用tokenizer。我想使用关键字tokenizer。我无法弄清楚我通过配置文件如何做到这一点。任何人都可以指出我通过配置文件来做到这一点吗？除此之外，可以通过对索引执行POST来调整索引，同时启动和运行索引？我真的很想了解如何使用这个，谢谢。编辑/更新：我无法将curl - ..

发布时间：2017-08-06 22:41:03 rest elasticsearch config 分布式计算/Hadoop

过滤掉元数据字段，只返回弹性搜索中的源字段

有没有办法告诉弹性搜索不返回任何元数据？目前我可以选择要在源中返回哪些字段。但我只想要来源的字段。我不喜欢没有返回的元数据，因为我不需要它，并将节省一些不必要的解析和传输等。我发现 ..

发布时间：2017-08-06 22:40:50 elasticsearch 分布式计算/Hadoop

在弹性搜索中创建或更新映射

我是Elasticsearch的新手，目前正在努力实施一个 geo_distance 过滤器进行搜索。到目前为止，我的索引具有以下映射（我已经删除了一些字段）： { advert_index：{ 映射：{ advert_type：{ 属性：{ __v：{ 类型：“long” }， caption：{ 类型：“string” }，类别：{ 类型：“string” }， **位 ..

发布时间：2017-08-06 22:40:36 indexing elasticsearch geocoding 分布式计算/Hadoop

如何明智地结合shingles和edgeNgram来提供灵活的全文搜索？

我们有一个符合OData的API，将其全部搜索需求的一部分委派给Elasticsearch集群。由于OData表达式可能会变得相当复杂，因此我们决定将它们简单地转换为相同的Lucene查询语法，并将其提供给 query_string 查询。我们支持一些文本相关的OData过滤器表达式，例如： startswith（field，'bla'） endswith（field，'bla ..

发布时间：2017-08-06 22:40:19 regex elasticsearch lucene odata analyzer 分布式计算/Hadoop

ElasticSearch&附件类型（NEST C＃）

该文件已编入索引，但搜索结果返回0次匹配。我需要搜索结果才返回文档ID和高亮结果（不含base64内容）这是代码：我会感谢在这里的任何帮助，谢谢， class Program { static void Main （string [] args） { //创建客户端 string index =“myindex”; var set ..

发布时间：2017-08-06 22:40:06 elasticsearch attachment nest 分布式计算/Hadoop

弹性搜索过滤文档按字段

我有一些文件： {“name”：“John”，“district”：1}， {“name”：“Mary”，“district”：2}， {“name”：“Nick”，“district”：1}， {“name” ，“区”：3}， {“name”：“肯尼”，“区”：1} 如何按区划过滤/选择不同的文件？ {“name”：“John” “区”：1}， {“ ..

发布时间：2017-08-06 22:39:52 elasticsearch group-by distinct 分布式计算/Hadoop

弹性搜索：文档中自定义分数字段的影响评分

我有一组通过NLP algos从文本中提取的单词，每个文档中的每个单词都有相关的分数。例如：文档1：{“vocab” [{“wtag”：“James Bond”，“rscore”：2.14}， {“wtag”：“world”，“rscore”：0.86}， ....， {“wtag”：“somemore”，“rscore”：3.15} ] } 文档2：{“vocab ..

发布时间：2017-08-06 22:39:39 elasticsearch 分布式计算/Hadoop

ElasticSearch&轮胎：使用Mapping和to_indexed_json

在阅读轮胎文档时，我的印象是你应该使用映射或 to_indexed_json 方法，因为（我的理解是..）映射用于提供 to_indexed_json 。问题是，我发现一些使用两个教程。为什么？基本上，我的应用程序现在使用 to_indexed_json ，但我无法弄清楚如何设置某些属性的增强值（因此我开始关注映射的原因），我想知道如果使用两者会产生一些冲突。解决方案 ..

发布时间：2017-08-06 22:39:25 ruby-on-rails ruby elasticsearch tire 分布式计算/Hadoop

弹性搜索按照一个数组的大小进行过滤

如何过滤具有一个数组的字段并具有多个N元素的文档？如何过滤具有字段的文档？空数组？是解决方案吗？如果是，那么怎么样？解决方案我将看看脚本过滤器。以下过滤器应仅返回 fieldname 字段中至少有10个元素的文档，这是一个数组。请记住，这可能是昂贵的，具体取决于你的索引中有多少文件。 “filter”：{ “script”：{ “script”：“doc ['fi ..

发布时间：2017-08-06 22:39:12 elasticsearch 分布式计算/Hadoop

弹性搜索动态脚本禁用

我正在对汇总进行以下查询： aggs：{ total：{ 总和：{ script：“doc ['comments']。value + doc ['likes']。value + doc ['shares']。value” } } } ，并引发以下异常： ScriptException [动态脚本禁用] 任何想法如何解决这个问题。参考： ..

发布时间：2017-08-06 22:38:59 elasticsearch 分布式计算/Hadoop

如何使用摄取附件插件在Elasticsearch 5.0.0中编制一个pdf文件？

我是Elasticsearch的新手，我在这里阅读 https：// www .elastic.co / guide / en / elasticsearch / plugins / master / mapper-attachments.html 在弹性搜索5.0.0中不推荐使用mapper-attachments插件。我现在尝试使用新的摄取附件插件索引pdf文件并上传附件。我迄 ..

发布时间：2017-08-06 22:38:33 pdf elasticsearch plugins attachment elasticsearch-plugin 分布式计算/Hadoop

从索引/类型删除所有文档，而不删除类型

我知道可以通过deleteByQuery删除某个类型的所有文档。示例： curl -XDELETE'http：// localhost：9200 / twitter / tweet / _query'-d'{ “query”：{ “term”：{“user “：”kimchy“} } }' 但是我没有而且只需要删除该类型的所有文档，无论什么条件。实现这一目标的最 ..

发布时间：2017-08-06 22:38:19 elasticsearch 分布式计算/Hadoop

弹性关系映射（一对一关系映射）

在我的弹性搜索服务器中，我有一个索引 http：// localhost：9200 / blog 。（博客）索引包含多种类型例如： http：// localhost：9200 / blog / posts ， http ：// localhost：9200 / blog / tags 。在标签类型中，我创建了超过1000个标签和10个帖子类型。例如：帖子 ..

发布时间：2017-08-06 22:38:06 elasticsearch mapping relationship elastica 分布式计算/Hadoop

弹性搜索地图对not_analyzed文档不敏感

我有一个带有以下映射的类型 PUT / testindex { “mappings”： { “products”：{ “properties”：{ “category_name”：{ “type”：“string”， “index”：“not_analyzed “ } } } } } 我想搜索一个确切的单词。这是为什么我设置为not_analyzed。 ..

发布时间：2017-08-06 22:37:53 elasticsearch 分布式计算/Hadoop