cumsum相关内容
我有一个按日期和时间排序的数据帧,如下所示: ID Date Time A B C abc 06/Feb 11 12 12 10 abc 06/Feb 12 14 13 5 xyz 07/Feb 1 16
..
有数据框: df
..
..
我有一个 pandas df,其字数与文章相对应.我希望能够添加另一列 MERGED,该列基于具有最小累积总和“min_words"的文章组. df = pd.DataFrame([[ 0, 6],[1, 10],[3, 5],[4, 7],[5, 26],[6, 7],[9, 4],[10, 133],[11, 42],[ 12, 1]],列=['ARTICLE','WORD_COUNT'])
..
ve 我需要计算列 calc 中的 cumsum,但它需要重置为零并在其值为负数时重新开始..我已经尝试了几个条件,但它并没有真正起作用...... 另外,是否有可能在 dplyr 中实现这一点?我是 dplyr 的新手,每当我需要使用依赖值时发现它有点困难.. 感谢您的帮助! 应该是这样的.. 已计算1 17 172 -9 83 9 174 -17 05 17 176
..
我有一个 numpy 布尔数组 w=np.array([True,False,True,True,False,False,False]) 我想获取第一次有 n_at_least 错误值的索引.比如这里 `n_at_least`=1 ->期望索引=1`n_at_least`=3 ->期望索引=4 我试过了 np.cumsum(~w) 每次遇到 False 值时都会增加.但是,当遇到 Tr
..
我有一个data.table dt如下. df 我想获得各列的累积总和.我只是在行中得到它.如何在 data.table 中执行此操作. dt[, 1:3 := cumsum(dt)]dtt1 t3 t71:0 12 252:0 17 733:0 25 804:0 34 895:0 39 103 想要的输出如下: dtt1 t3 t71:0 12 372:0 5 533:0 8 154
..
如果我有这个我得到一个错误 sum(vector) == cumsum(vector)(length(vector))>>错误:()-索引必须出现在索引表达式的最后. 我知道我能做到: Vec1 = cumsum(mat);总和(垫子)== Vec1(长度(垫子)) 这将返回一个逻辑 1. 有没有其他方法可以将所有内容放在一行上? 解决方案 好吧,如果你绝对下定决心要一口气搞
..
我有一个非常大的数据集,看起来像这样简化: 行.member_id entry_id comment_count 时间戳1 1 4 2008-06-09 12:41:002 1 b 1 2008-07-14 18:41:003 1 c 3 2008-07-17 15:40:004 2 d 12 2008-06-09 12:41:005 2 e 50 2008-09-18 10:22:006 3
..
numpy 或 scipy(或其他一些库)中是否有一个函数可以将 cumsum 和 cumprod 的概念推广到任意函数.例如,考虑(理论)函数 cumf(func, 数组) func 是一个函数,它接受两个浮点数,并返回一个浮点数.特殊情况 lambda x,y: x+y 和 lambda x,y: x*y 分别是 cumsum 和 cumprod.例如,如果 func = lam
..
我有一个包含两列 ID 和活动的数据框.活动为 0 或 1.我想要一个包含自上次活动为 1 以来不断增加的数字的新列.但是,计数应仅在一个组 (ID) 内.如果活动为 1,则计数列应重置为 0,然后重新开始计数. 所以,我有一个包含以下内容的数据框: 想要的是这个: 有人可以帮我吗? 解决方案 我们在这里使用了一个新的段 'G' df['G']=df.groupby('
..
我现在花了几个小时试图在 Pandas 数据框上做一个“按总和累积分组".我已经查看了所有 stackoverflow 的答案,令人惊讶的是,它们都不能解决我的(非常基本的)问题: 我有一个数据框: df1出[8]:姓名 日期 金额0 杰克 2016-01-31 101 杰克 2016-02-29 52 杰克 2016-02-29 83 吉尔 2016-01-31 104 吉尔 201
..
我有 df = pd.DataFrame.from_dict({'id': ['A', 'B', 'A', 'C', 'D', 'B', 'C'], 'val': [1,2,-3,1,5,6,-2], '东西':['12','23232','13','1234','3235','3236','732323']})id 东西 val0 12 11 乙 23232 22 A 13 -33 C 123
..
ve 我需要计算列 calc 中的 cumsum,但它需要重置为零并在其值为负时重新开始.我已经尝试了几种条件,但它并没有真正起作用... 另外,是否可以在 dplyr 中实现这一点?我是 dplyr 的新手,每当我需要使用依赖值时都会发现它有点困难.. 感谢您的帮助! 它应该是... ve calc1 17 172 -9 83 9 174 -17 05 17 176 -
..
我有一个数据框,该数据框已经根据需要进行了排序,但现在我想将其“切片"成组. 该组的最大累计值应为10,当累计值>10时,应重置累计总和并重新开始 库(dplyr)id 这是我正在寻找的输出(我是“手动"完成的) cumsum_10 所以我有两个问题 如何创建每次超过上限(在本例中为 10)时重置的累积变量 如何对每组进行计数/分组 对于第一部分,我尝试了 grou
..
我觉得这是一个相当简单的问题,但对于我的生活,我似乎无法找到答案.我有一个相当标准的数据框,我想要做的是对一列值求和,直到它们达到某个值(确切值或大于它),此时它将 1 放入一个新列(标记为保持)并在 0 处重新开始求和. 我有一列分钟、分钟之间的差异、一个保持列和一个累积总和列(我使用的示例比实际的完整数据集清晰得多) 分差保持差值_sum1052991158 0 0 01052991
..
如果我有一个 pandas.core.series.Series 名为 ts 的 1 或 NaN,如下所示: 3382 NaN第3381章...第3369章第3368章...15 110 南11 112 113 19 南8 纳米7 纳米6 纳米3 南4 15 12 南1 纳米0 南 我想计算这个系列的 cumsum,但它应该在 NaN 的位置重置(设置为零),如下所示: 3382 03381
..
我有一个 Pandas 数据框定义为: A B SUM_C1 1 101 2 20 我想计算 SUM_C 的累积总和并将其作为新列添加到同一数据框中.换句话说,我的最终目标是拥有一个如下所示的数据框: A B SUM_C CUMSUM_C1 1 10 101 2 20 30 在 group() 上使用 Pandas 中的 cumsum 显示了生成的可能性一个新的数据框,其中列名 SUM_C
..
我在 DataFrame 中有一个带有值的列: [1, 1, -1, 1, -1, -1] 我怎样才能像这样将它们分组? [1,1] [-1] [1] [-1, -1] 解决方案 您可以使用 groupby 自定义Series: df = pd.DataFrame({'a': [1, 1, -1, 1, -1, -1]})打印 (df)一种0 11 12 -13 14 -15 -1打印
..
我需要计算 R 中每组的运行 cumsum,但是 cumsum 的窗口只能是最后 3 个观察值: 例如,如果我有一个包含人名、日期和分数的表格,如下所示: 姓名 日期 分数约翰一书 2017-01-01 42 约翰 2017-01-02 53 约翰 2017-01-03 34 约翰 2017-01-04 15 约翰 2017-01-05 46 约翰 2017-01-06 47 本 201
..