分布式计算/Hadoop

logstash jdbc连接器基于时间的数据

在这里使用新的logstash jdbc连接器: https://www.elastic.co/guide/en/logstash/current/plugins-inputs-jdbc.html 后续的logstash如何运行效果已经编入ElasticSearch的内容?它是否在ES索引中创建新文档,还是更新与已经被索引的行匹配的文档?我试图解决的用例是将带有时间戳的行索引到弹性搜索中, ..
发布时间:2017-08-06 23:02:13 分布式计算/Hadoop

如何在Windows中进行堆转储,停机时间最短?

我想知道为什么Elasticsearch节点上的JVM堆使用率一直在80%以上。为了做到这一点,我通过运行 jmap.exe -heap:format = b 5348 (5348是进程ID)。然后我可以使用VisualVM分析转储。 问题是,在执行转储时,$ code> jmap 暂停JVM,所以节点基本上离线了大约5分钟。 本文提出了一种更快速的 ..
发布时间:2017-08-06 23:01:42 分布式计算/Hadoop

保留ElasticSearch查询中的条款顺序

一个简单的例子是使用标准分析器对这些文档进行索引: ElasticSearch中是否可能形成一个保留条款顺序的查询。 / p> 你知道搜索 你知道搜索 知道搜索你 我可以查询 +你+搜索将给我所有的文件,包括第三个。 如果我只想检索具有这个特定顺序的条款的文件怎么办?我可以形成一个对我来说的查询? 考虑到短语可以通过简单的引用文本:“你知道” / code>(检索第一 ..
发布时间:2017-08-06 23:01:27 分布式计算/Hadoop

弹性搜索分层排序

我希望能够以特定顺序返回头像。例如,搜索 Para 应该返回: 对乙酰氨基酚 Parafin LIQUID PARAFFIN ISOMETHEPTENE WITH PARACETAMOL 1)从搜索字词para开始的建议应按顶部和字母顺序排序 2)其余的项目应 更新 如果我希望输出如下: 对乙酰氨基酚 Pa ..
发布时间:2017-08-06 23:01:14 分布式计算/Hadoop

前N个结果的聚合

问题: 如果我搜索“iphone”,我得到400个产品结果和产品类别聚合我已经返回前3 这些类别包括智能手机,手机套和手机配件。 如果我搜索“iphone 6”我得到1400结果,因为额外的“6”返回匹配更多的产品。产品类别聚合现在返回所有这些结果的前3个类别。 目前,前3个产品类别将从电缆到计算机显示器都是一切。 我需要做的是获得前100名成绩的前3名。 我尝 ..
发布时间:2017-08-06 23:01:01 分布式计算/Hadoop

弹性搜索 - 用连字符搜索

弹性搜索1.6 我想索引包含连字符的文本,例如U-12,U-17,WU-12,T恤...并且能够使用“简单查询字符串”查询来搜索它们。 数据样本(简化): {“title”:“U-12 Soccer”, “comment”:“t恤衫很脏”} 由于已经有很多关于连字符的问题,我已经尝试了以下解决方案: 使用字符过滤器: ElasticSearch - ..
发布时间:2017-08-06 23:00:47 分布式计算/Hadoop

Elasticsearch插件来分类文档

对我而言,最好的解决方案是将其分类为所有最常见的术语(/概念)以用户可以浏览的标签云显示。 有没有办法实现?任何建议? 谢谢 解决方案 基本思想是使用 条款聚合,每个条款将产生一个桶。 POST / _search { “aggs”:{ “genres”:{ “terms”:{“field”:“genre”} } } } 您将获得的回复将通过 ..
发布时间:2017-08-06 23:00:33 分布式计算/Hadoop

弹性搜索中存储的字段

在文档中,某些类型,如数字和日期,它指定该商店默认为no。但是,该字段仍然可以从json检索。 它的混乱。这是否意味着_source? 有没有办法不存储一个字段,只需要索引和可搜索? 解决方案 默认情况下,不存储任何字段类型。只有 _source 字段是。这意味着您可以随时收回您发送到搜索引擎的内容。即使您要求具体字段,弹性搜索将会为您解析 _source 字段,并返回这些字段 ..
发布时间:2017-08-06 23:00:20 分布式计算/Hadoop

ElasticSearch - 用连字符搜索名称

我有一个产品目录,我使用Elastica客户端在ElasticSearch中进行索引。我非常新的ElasticSearch BTW。 我的目录中有产品有't-shirt'他们的名字。但是,如果我输入'tshirt',则搜索结果不会出现。 我该怎么做 我已经遵循此教程,并为索引实施以下内容: 'analysis'=> array( 'analyzer'=> array( 'i ..
发布时间:2017-08-06 23:00:05 分布式计算/Hadoop

ElasticSearch发送数据时发生错误

我正在尝试将JSON发送到elasticSearch。我试过使用Postman和SOAPUI 数据是 [{“column1”:“abc”,“column2 “:”def“,”column3“:”dghi“,”column4“:”jkl“,”column5“:”mno“},{”column1“:”pqr“,”column2“:”stu“,”column3 “:”vwx“,”column4“ ..
发布时间:2017-08-06 22:59:31 分布式计算/Hadoop

弹性搜索中的许多关系

我知道在弹性搜索中,我们可以在文档之间小孩/父母关系 。 然后,当索引时,我可以传递父ID,以便链接到小孩和父文档: $ curl -XPUT localhost:9200 / blogs / blog_tag / 1122?parent = 1111 -d'{“tag”:“something”}' 有没有办法在弹性搜索中建立多对多的关系? 数据驻留在具有以 ..
发布时间:2017-08-06 22:58:57 分布式计算/Hadoop

如何在弹性搜索中避免嵌套类型的跨对象搜索行为

我试图确定在弹性搜索中索引文档的最佳方式。我有一个文件Doc,它有一些字段: Doc created_at updated_at field_a field_b 但是,Doc也会有一些特定于个人用户的字段。例如,field_x对于用户1将具有值“A”,对于用户2,field_x将具有值“B”。对于每个文档,将存在非常有限数量的用户(通常为2,最多〜10)。 ..
发布时间:2017-08-06 22:58:41 分布式计算/Hadoop

创建索引Nest

如何使用Elasticsearch Nest API重新创建以下索引? 这是索引的json,包括映射: { “settings”:{ “analysis”:{ “filter”:{ “trigrams_filter” :{ “type”:“ngram”, “min_gram”:3, “max_gram”:3 } }, “ “:{ ”trigrams“:{ ”type“:”cust ..
发布时间:2017-08-06 22:58:28 分布式计算/Hadoop

内部命中不能使用嵌套过滤器?

我刚刚升级到Elastic Search 1.5.0,到目前为止,我无法使 inner_hits 使用嵌套过滤器,虽然它可以正常使用嵌套查询。 假设我想在电影对象中检索内部嵌套对象 actors 。 当我运行以下嵌套查询: 语法1 GET my_index / movie / _search { “query”:{ “filtered”:{ “query”:{“mat ..
发布时间:2017-08-06 22:58:15 分布式计算/Hadoop

有没有办法排除弹性搜索查询中的字段

我知道使用字段设置只包括搜索中需要的字段 http://www.elasticsearch.org/guide/reference/api/search/fields/ ...但我想知道我是否可以做相反的...以某种方式指定一个或两个不希望包含在查询结果中的字段(例如附件)。只需要输出所有要减去一个或两个的字段就好像很痛苦,当我可以指定字段排除 解决方案 p>您可以使用源过滤(在1.6 ..
发布时间:2017-08-06 22:57:51 分布式计算/Hadoop

通过查询从Elasticsearch删除记录

我正在尝试从Elasticsearch中删除特定的日期记录。我的查询如下: curl -XDELETE'http:// localhost:9200 / twitter / twit / _query'-d ' { “filter”:{ “range”:{ “date_time”:{“from”:“2012-10-01 00:00:01” “to”:“2013-05-01 11:59:5 ..
发布时间:2017-08-06 22:57:24 分布式计算/Hadoop

从Elasticsearch脚本访问记录器

我用脚本积极地进行评分和聚合。我无法想像的是如何从脚本中发出日志。我试过console.log,但是没有解决。请让我知道,我可以从我的groovy脚本中发出日志。 解决方案 这可以通过访问全局Elasticsearch记录器实例来完成。 它的groovy示例在下面给出 你应该能够为javascript和其他脚本语言做类似的事情。 import org.elasticsearch ..
发布时间:2017-08-06 22:57:11 分布式计算/Hadoop

如何通过使用弹性搜索聚合返回唯一文档的计数

我遇到一个问题,弹性搜索不能通过在嵌套字段上使用术语聚合来返回唯一文档的计数。 以下是我们的模型示例: { ..., “location”:[ {“city” :“纽约”,“州”:“ny”}, {“city”:“woodbury”,“state”:“ny”}, ... ] ... } 我想在状态字段上进行聚合,但是这个文件将在“ny”桶中被计数两次, ..
发布时间:2017-08-06 22:56:58 分布式计算/Hadoop

弹性搜索索引上次更新时间

有没有办法从ElasticSearch检索特定索引何时上次更新? 我的目标是能够知道什么时候是在索引中插入/更新/删除任何文档的最后一次。如果这不可能,我可以在我的索引修改请求中添加一些可以在以后提供此信息的内容吗? 解决方案 您可以从 _timestamp 为了更容易返回时间戳,您可以设置弹性搜索来存储: curl -XPUT“http:// localhost:9200 ..
发布时间:2017-08-06 22:56:21 分布式计算/Hadoop