aggregate相关内容

后置过滤器和全面聚合的分面搜索有什么区别?

搜索界面中的常见问题是您希望返回一组结果 ,但可能希望返回有关所有文档的信息。 (例如,我想看到所有的红色衬衫,但想知道什么 其他颜色可用)。 这有时被称为“分面结果” ,或 “分面导航”。 弹性搜索引用的示例在解释为什么/如何,非常清楚,所以 我用这个作为这个问题的基础。 总结/问题:看来我可以同时使用后置过滤器或全局聚合。他们都似乎以 的方式提供完全相同的功能。他们可能有 ..

如何获得具有多个字段的弹性搜索聚合

我正在尝试找到与当前正在浏览的标签相关的标签。我们的索引中的每个文档都被标记。每个标签由两部分组成:ID和文本名称: { ... meta $ { ... 标签: id:456, name:'Cakes' }, { id:789, name:'Breads' } ] } } 要获取相关标签只需查询文档并得到其标签的总和: { “que ..
发布时间:2017-08-07 00:15:17 分布式计算/Hadoop

深层嵌套类型的弹性搜索聚合

以前我已经询问过这个问题。 示例文档中有一个简化的文档。这对我来说了解非嵌套类型与嵌套类型之间的聚合差异是有好处的。然而,简化是隐藏着更多的复杂性,所以我必须在这里进行扩展。 所以我的实际文档更接近于以下内容: “_ source”:{ “keyword”:“my keyword”, “response”:[ { “results”:[ { “items”:[ { “pr ..
发布时间:2017-08-07 00:02:14 分布式计算/Hadoop

弹性搜索度量聚合:数组中的元素数

我想做一个相当涉及的查询/聚合。我看不清,因为我刚刚开始使用ES。文件我看起来像这样: { “关键字”:“一些关键字”, “items”:[ { “name”:“我的第一项”, “item_property_1”:“A”, (其他属性) { “name”:“我的第二项”, “item_property_1”:“B”, (其他属性) }, { “name”:“我的第三项”, “it ..
发布时间:2017-08-07 00:01:59 分布式计算/Hadoop

弹性搜索:可以处理聚合结果?

我使用SUM-Aggregation计算我的服务进程的持续时间。执行过程的每个步骤都将保存在Elasticsearch的呼叫ID中。 这是我监控的: ID#123(呼叫服务#1)的服务器响应持续时间 ** ID#123的完整持续时间** ID#124(呼叫服务#1)的请求处理持续时间 持续时间ID#124的服务器响应(呼叫服务#1) ** ID#124的完 ..
发布时间:2017-08-06 23:03:19 分布式计算/Hadoop

综合解决多个事实

尝试创建一个计算特定事实的两个日期之间的时间段的谓词( timePeriod / 2 )。我自己设法做到这一点,但在同一列表中存在“其他答案”时(即使用例子更容易解释),面临问题。 我有以下知识库事实; popStar('Jackson',1987,1991)。 popStar('Jackson',1992,1996)。 popStar('Michaels',1996,200 ..
发布时间:2017-07-21 00:11:00 其他开发

如何输出重复的行

我有以下数据: x1 x2 x3 x4 34 14 45 53 2 8 18 17 34 14 45 20 19 78 21 48 2 8 18 5 在第1行和第3行中;和2和5列X1,X2,X3的值相等。如何只输出那些相同数字的4行?输出的格式如下: x1 x2 x3 x4 34 14 45 53 34 14 45 20 2 8 ..
发布时间:2017-07-20 23:27:27 其他开发

R在一列中查找重复项,并在第二列中折叠

我有一个数据框架,两列联系人字符串。在一列中(命名为 probes )我有重复的情况(也就是说,几个情况下使用相同的字符串)。对于探针中的每种情况,我想查找包含相同字符串的所有案例,然后将第二列(名为基因)中的所有相应案例的值合并到单个案例 例如,如果我有这样的结构: 探针基因 1 cg00050873 TSPY4 2 cg00061679 DAZ1 3 cg00061679 D ..
发布时间:2017-07-20 23:20:56 其他开发

dplyr group_by出错

这是我的数据集 N Pl 10,WO 20, EI 10,WO 20,WO 30,EI 我的预期输出是 N Pl 10,2 20,1 30 ,1 所以,基本上,我正在计数每个值为N的pl的数字 我正在尝试dplyr。我知道大概这也可以用aggregate()完成,但我不知道该怎么做。所以在dplyr ..
发布时间:2017-07-13 22:44:53 其他开发语言

dplyr:组数的平均值

x%group_by(Date,`%Bucket`)%>%summarize(count = n()) 日期%Bucket计数 (date)(fctr)(int) 1 2015-01-05 2 2015-01-05(1-25)421 3 2015-01-05(25-50)461 4 2015-01-05(50-7 ..
发布时间:2017-07-13 22:12:47 其他开发语言