分布式计算/Hadoop

如何设置ES集群?

假设我有5台机器,我想要运行一个弹性搜索集群,它们都连接到共享驱动器。我把弹性搜索的一个副本放在共享驱动器上,所以三个人都可以看到它。我只是在我的机器上的共享驱动器上启动弹性搜索,并且群集会自动运行它的魔法?或者我必须配置特定的设置以使弹性搜索实现它在5台机器上运行?如果是,相关设置是什么?我应该担心配置副本还是自动处理? 解决方案 它的超级简单。 您需要每台机器拥有自己的Elast ..
发布时间:2017-08-06 22:32:18 分布式计算/Hadoop

有没有更聪明的方式来索引弹性搜索?

我问我是因为我们的工作正在处于一种流淌状态,但是每当我们修改索引(更改分类器或过滤器,或碎片/副本的数量)时,我们都必须把整个索引并将所有的Rails模型重新指定为弹性搜索,这意味着我们必须考虑停机时间来重新索引所有的记录。 是否有 解决方案 我觉得@karmi是正确的。但是让我解释一下一点。我需要偶尔使用一些新的属性或分析设置升级生产模式。 我最近开始使用下面描述的场景进行实时, ..
发布时间:2017-08-06 22:31:52 分布式计算/Hadoop

我们可以用弹性搜索版本检索以前的_source文档

我已阅读ES上有关版本控制的博文。 然而,我希望能够从更新中获取以前的“_souce”文档。 例如,让我们说我有这个对象: { “name”:“John”, “age” :32, “job”:“janitorial technician” } //这成为版本1 我将其更新为: { “name”:“John “, ”年龄“:32, ”工作“:”总统 ..
发布时间:2017-08-06 22:31:23 分布式计算/Hadoop

Elasticsearch 2.1:结果窗口太大(index.max_result_window)

我们从Elasticsearch 2.1检索信息,并允许用户浏览结果。当用户请求高页数时,我们会收到以下错误消息: 结果窗口太大,从+大小必须小于或等于 到:[10000],但是[10020]。请参阅scroll api以获得更高效的 方式来请求大型数据集。可以通过更改 [index.max_result_window]索引级别参数 来设置此限制弹性文档表示这是因为内存消耗高,并 ..
发布时间:2017-08-06 22:31:10 分布式计算/Hadoop

ElasticSearch - 返回唯一值

如何从记录中获取所有语言的值,并使其独一无二。 记录 PUT items / 1 {“language”:10} PUT项目/ 2 {“language”:11} PUT项目/ 3 {“language”:10} 查询 GET items / _search {...} #=>预期回应 [10,11] ..
发布时间:2017-08-06 22:30:56 分布式计算/Hadoop

弹性搜索:“术语”,“匹配短语”和“查询字符串”之间的区别

这里新增弹性搜索,并尝试更好地了解这些查询之间的区别。据我所知,术语匹配单个术语(需要小写匹配才能工作),而匹配短语和查询字符串匹配一串文本。 解决方案 p> 术语查询符合单个术语:该值为未分析。 所以,根据你所索引的内容,它不一定要更低。 如果你提供了 Bennett 在索引时间,值不分析,以下查询不会返回任何内容: { “查询”:{ “term”:{“user”:“ben ..
发布时间:2017-08-06 22:30:32 分布式计算/Hadoop

使弹性搜索只返回某些字段?

我正在使用弹性搜索来索引我的文档。 是否可以指示它只返回特定字段而不是其存储的整个json文档? 解决方案 是的!使用源过滤器。如果您正在使用JSON进行搜索,则会显示如下: { “_source”:[“用户“,”消息“,...], ”查询“:..., ”大小“:... } 在ES 2.4及更早版本中,您还可以使用 ..
发布时间:2017-08-06 22:30:19 分布式计算/Hadoop

弹性搜索,多个索引与一个索引和不同数据集的类型?

我有一个使用MVC模式开发的应用程序,我想现在索引多个模型,这意味着每个模型都有不同的数据结构。 最好使用多个索引,每个模型一个索引或每个模型的相同索引中的类型?两种方式也需要我想到的不同的搜索查询。 如果数据集很小或巨大,两种概念之间是否存在差异性? 我将自己测试第二个问题,如果有人可以为此推荐一些好的示例数据。 解决方案 这两种方法有不同的含义。假设您正在使用Elas ..
发布时间:2017-08-06 22:30:06 分布式计算/Hadoop

ES不断返回每个文档

我最近继承了一个ES实例,并确保我在发布之前阅读了一本关于ES封面的整本书,但是我恐怕无法找到简单的例子。 我有一个索引,在我们的分期环境中,展示了每个文档的返回行为,无论什么 - 我有一个类似的索引在我们的质量检查环境,这是我期望的工作。例如,我针对 http://分期:9200 / people_alias / _search?explain : {“查询”: {“已过滤”: ..
发布时间:2017-08-06 22:29:52 分布式计算/Hadoop

FIELDDATA数据太大

我打开kibana并进行搜索,我得到了碎片失败的错误。我查看了elasticsearch.log文件,我看到这个错误: org.elasticsearch.common.breaker.CircuitBreakingException:[FIELDDATA ]数据太大,[@timestamp]的数据将大于[622775500 / 593.9mb]的限制 解决方案 您 ..
发布时间:2017-08-06 22:29:26 分布式计算/Hadoop

我可以在ids筛选器或一般的查询子句中指定的值的最大限制?

在弹性搜索中,最大限制是指定可执行匹配的值的值的值?我读到某处是1024,但也是可配置的。真的吗?它如何影响性能? curl -XPOST'localhost:9200 / my_index / _search?pretty'-d'{ “query” { “filtered”:{ “filter”:{ “not”:{ “ids”:{ “type”:“my_type”, “values”:[ ..
发布时间:2017-08-06 22:29:13 分布式计算/Hadoop

如何在ElasticSearch中进行不分析?

我在ElasticSearch领域有一个字段,我不想分析,我。即应逐字存储和比较。这些值将包含字母,数字,空格,破折号,斜杠以及其他字符。 如果我在此字段的映射中不给出分析器,则默认值使用一个将我的逐字符串字符串拼写成单词的标记器。我不想要这个。 有没有一个超简单的分析仪,基本上不分析?或者有不同的方式表示这个领域不会被分析? 我只创建索引,我不做任何其他事情。我可以使用像“en ..
发布时间:2017-08-06 22:29:00 分布式计算/Hadoop

将字符串的默认映射更改为“未分析”在弹性搜索

在我的系统中,数据的插入总是通过logstash通过csv文件完成的。我从来没有预先定义映射。但是每当我输入一个字符串,它始终被认为是分析,结果是一个条目,如 hello我是Sinha 被分成 hello , I , am ,code>辛哈。有没有办法我可以改变弹性搜索的默认/动态映射,所以所有字符串,无论索引,不管类型是否被认为是不分析?还是有一种在 .conf 文件中设置它的方法?说我的 co ..

如何使用Kibana + Elastic Search检索字段的唯一计数

可以使用Kibana查询一个不同/唯一的字段计数吗?我正在使用弹性搜索作为我的后座到Kibana。 如果是,查询的语法是什么?我想查询一下Kibana界面的链接: http://demo.kibana.org/#/dashboard 我正在使用logstash解析nginx访问日志,并将数据存储到弹性搜索中。然后,我使用Kibana来运行查询并在图表中可视化我的数据。具体来说,我想知道 ..
发布时间:2017-08-06 22:28:34 分布式计算/Hadoop

如何更改弹性搜索最大内存大小

我有一个默认配置为Elasticsearch的Apache服务器,一切正常,除了默认配置的最大大小为1GB。 我不有如此大量的文件存储在Elasticsearch,所以我想减少记忆。 我看到我必须更改 -Xmx 参数在Java配置,但我不知道如何。 我看到我可以执行这个: bin / ElasticSearch -Xmx = 2G -Xms = 2G 但 ..
发布时间:2017-08-06 22:28:21 分布式计算/Hadoop

弹性搜索,是否可以更新嵌套对象而不更新整个文档?

我正在索引一组文档(想像它们作为论坛帖子),其中嵌套的对象是与该帖子相关的用户。我的问题是可能会更新用户字段,但由于帖子不更改,因此不会重新建立索引,并且用户嵌套对象变得过时。有没有办法更新嵌套的对象,而不重新索引整个文档?或者唯一的解决方案是每次用户更改时重新索引用户的所有相关帖子? 解决方案 您可以使用更新API。 curl -XPOST localhost:9200 / do ..
发布时间:2017-08-06 22:27:43 分布式计算/Hadoop

将JSON文件导入/索引到Elasticsearch

我是Elasticsearch的新手,已经手动输入数据,直到此为止。例如,我已经做了这样的事情: $ curl -XPUT'http:// localhost:9200 / twitter / tweet / 1'-d'{ “user”:“kimchy”, “post_date”:“2009-11-15T14:12:12”, “message”:“尝试弹性搜索“ }' 我现 ..
发布时间:2017-08-06 22:27:29 分布式计算/Hadoop

弹性搜索,轮胎和嵌套查询/与ActiveRecord的关联

我正在使用ElasticSearch和Tire来索引和搜索一些ActiveRecord模型,并且我一直在搜索“正确”的索引和搜索关联的方式。我没有找到什么似乎是最好的做法,所以我想问是否有人有一种方法,他们认为工作真的很好。 作为一个示例设置(这是补充但说明问题),假设我们有一本书,附有章节。每本书都有一个标题和作者,还有一堆章节。每章都有文字。我们希望为图书的字段和章节的文本索引,以便您可 ..
发布时间:2017-08-06 22:27:16 分布式计算/Hadoop