aggregate相关内容
在我们的一个新项目中,我们受到了这篇文章的启发。 http://project-a.github.io/on-site-search-design-patterns-for-e-commerce/#generic-faceted-search 问题基本是X- 20045 X- 200 X- 200 200 200 X- 200 200 X- 200 200 X- 200 200 X- 200
..
搜索界面中的常见问题是您希望返回一组结果 ,但可能希望返回有关所有文档的信息。 (例如,我想看到所有的红色衬衫,但想知道什么 其他颜色可用)。 这有时被称为“分面结果” ,或 “分面导航”。 弹性搜索引用的示例在解释为什么/如何,非常清楚,所以 我用这个作为这个问题的基础。 总结/问题:看来我可以同时使用后置过滤器或全局聚合。他们都似乎以 的方式提供完全相同的功能。他们可能有
..
假设我有这个给定的数据 { “name”:“ABC”, “favorite_cars”:[“ferrari”,“toyota”] },{ “name”:“ABC”, “favorite_cars”:[“ferrari”,“toyota” },{ “name”:“GEORGE”, “favorite_cars”:[“honda”,“Hyundae”] } 每当我搜索最
..
上下文和当前状态 我们将集群从Cassandra迁移到完整的ElasticSearch集群。我们正在索引文档,平均为〜250-300 docs per seconds 。在ElasticSearch 1.2.0中,每天代表〜8Go。 { “generic “: { ”id“:”twi471943355505459200“, ”type“:”twitter“, ”title“:”RT
..
我正在尝试找到与当前正在浏览的标签相关的标签。我们的索引中的每个文档都被标记。每个标签由两部分组成:ID和文本名称: { ... meta $ { ... 标签: id:456, name:'Cakes' }, { id:789, name:'Breads' } ] } } 要获取相关标签只需查询文档并得到其标签的总和: { “que
..
以前我已经询问过这个问题。 示例文档中有一个简化的文档。这对我来说了解非嵌套类型与嵌套类型之间的聚合差异是有好处的。然而,简化是隐藏着更多的复杂性,所以我必须在这里进行扩展。 所以我的实际文档更接近于以下内容: “_ source”:{ “keyword”:“my keyword”, “response”:[ { “results”:[ { “items”:[ { “pr
..
我想做一个相当涉及的查询/聚合。我看不清,因为我刚刚开始使用ES。文件我看起来像这样: { “关键字”:“一些关键字”, “items”:[ { “name”:“我的第一项”, “item_property_1”:“A”, (其他属性) { “name”:“我的第二项”, “item_property_1”:“B”, (其他属性) }, { “name”:“我的第三项”, “it
..
我使用SUM-Aggregation计算我的服务进程的持续时间。执行过程的每个步骤都将保存在Elasticsearch的呼叫ID中。 这是我监控的: ID#123(呼叫服务#1)的服务器响应持续时间 ** ID#123的完整持续时间** ID#124(呼叫服务#1)的请求处理持续时间 持续时间ID#124的服务器响应(呼叫服务#1) ** ID#124的完
..
以下是我的代码: sFieldList.Select(y =>“Sum(Convert.ToDouble(iif [\“”+ y +“\”] == @ 0,0,它[\“”+ y +“\”]))))为“+ y”,然后 var newSort = dataTable .AsEnumerable() .AsQueryable() .GroupBy(“new(”+ gField +“
..
尝试创建一个计算特定事实的两个日期之间的时间段的谓词( timePeriod / 2 )。我自己设法做到这一点,但在同一列表中存在“其他答案”时(即使用例子更容易解释),面临问题。 我有以下知识库事实; popStar('Jackson',1987,1991)。 popStar('Jackson',1992,1996)。 popStar('Michaels',1996,200
..
我有以下数据: x1 x2 x3 x4 34 14 45 53 2 8 18 17 34 14 45 20 19 78 21 48 2 8 18 5 在第1行和第3行中;和2和5列X1,X2,X3的值相等。如何只输出那些相同数字的4行?输出的格式如下: x1 x2 x3 x4 34 14 45 53 34 14 45 20 2 8
..
我有一个数据框架,两列联系人字符串。在一列中(命名为 probes )我有重复的情况(也就是说,几个情况下使用相同的字符串)。对于探针中的每种情况,我想查找包含相同字符串的所有案例,然后将第二列(名为基因)中的所有相应案例的值合并到单个案例 例如,如果我有这样的结构: 探针基因 1 cg00050873 TSPY4 2 cg00061679 DAZ1 3 cg00061679 D
..
我有一个数据框,如下所示: Chr start stop ref alt Hom / het ID chr1 5179574 5183384 ref Del Het 719 chr1 5179574 5184738 ref Del Het 915 chr1 5179574 5184738 ref Del Het 951 chr1 5336806 5358384 ref De
..
这是我的数据集 N Pl 10,WO 20, EI 10,WO 20,WO 30,EI 我的预期输出是 N Pl 10,2 20,1 30 ,1 所以,基本上,我正在计数每个值为N的pl的数字 我正在尝试dplyr。我知道大概这也可以用aggregate()完成,但我不知道该怎么做。所以在dplyr
..
x%group_by(Date,`%Bucket`)%>%summarize(count = n()) 日期%Bucket计数 (date)(fctr)(int) 1 2015-01-05 2 2015-01-05(1-25)421 3 2015-01-05(25-50)461 4 2015-01-05(50-7
..
我有一个大的数据集,具有个人和日期的唯一ID,每个人都有多次遇到。 以下是代码以及这些数据的外观示例: strDates
..
最终目标是将 product_info 中的每个记录的总数量( transact_data $ qty )加起来,其中 transact_data $ productId 存在于 product_info 中,其中 transact_data $ date 在 product_info $ beg_date 和 product_info $ end_date 之间。 product_inf
..
更新:我有一个数据框架'test',如下所示: session_id seller_feedback_score 1 1 282470 2 1 275258 3 1 275258 4 1 275258 5 1 37831 6 1 282470 7 1 26 8 1 138351 9 1 321350 10 1 841 11 1 138351
..
可以使用dplyr在列名上使用正则表达式匹配 group_by library(dplyr)#dplyr_0.5.0; R版本3.3.2(2016-10-31) #虚拟数据 set.seed(1) df1 % mutate(Sepal.Length = round(Sepal.Length), Sepal.Width = rou
..
以下是一些示例数据: set.seed(42) tm
..