pandas-groupby相关内容

为什么熊猫滚动使用一维ndarray

我的动机是使用 pandas rolling 功能来执行滚动多因子回归(这个问题不是关于滚动多因子回归).我希望我能够在 df.rolling(2) 之后使用 apply 并获取结果 pd.DataFrame 提取 ndarray使用 .values 并执行必要的矩阵乘法.结果不是这样. 这是我发现的: 将pandas导入为pd将 numpy 导入为 npnp.random.seed([3 ..
发布时间:2021-12-26 23:53:41 Python

在pandas groupby之后对每组进行采样

我知道这一定在某些地方得到了回答,但我就是找不到. 问题:groupby操作后对每组进行采样. 将pandas导入为pddf = pd.DataFrame({'a': [1,2,3,4,5,6,7],'b': [1,1,1,0,0,0,0]})分组 = df.groupby('b')# 现在从每组采样,例如,我想要每组的 30% 解决方案 应用 lambda 并调用 sample 带有 ..
发布时间:2021-12-21 15:51:29 Python

Python Pandas 组中的最大值作为新列

我正在尝试计算一个新列,其中包含多个组中每个组的最大值.我来自 Stata 背景,所以我知道 Stata 代码将是这样的: by group, sort: egen max = max(odds) 例如: data = {'group' : ['A', 'A', 'B','B'],“赔率":[85, 75, 60, 65]} 然后我希望它看起来像: 最大组赔率一个 85 85一个 75 ..
发布时间:2021-12-07 09:56:26 Python

pandas 数据框 groupby datetime 月份

考虑一个 csv 文件: 字符串、日期、数字一个字符串,2/5/11 9:16am,1.0一个字符串,3/5/11 10:44pm,2.0一个字符串,4/22/11 12:07pm,3.0一个字符串,4/22/11 12:10pm,4.0一个字符串,4/29/11 11:59am,1.0一个字符串,5/2/11 1:41pm,2.0一个字符串,5/2/11 2:02pm,3.0一个字符串,5/2 ..
发布时间:2021-12-03 09:11:41 Python

Pandas groupby 累计总和

我想在我的 Pandas 数据框中添加一个累积总和列,以便: 名称 |日 |不-----|-----------|----杰克 |星期一 |10杰克 |星期二 |20杰克 |星期二 |10杰克 |星期三 |50吉尔 |星期一 |40吉尔 |星期三 |110 变成: 杰克 |星期一 |10 |10杰克 |星期二 |30 |40杰克 |星期三 |50 |90吉尔 |星期一 |40 |40吉尔 | ..
发布时间:2021-12-03 08:52:53 Python

做groupby时保留其他列

我在 Pandas 数据帧上使用 groupby 来删除所有没有特定列最小值的行.像这样: df1 = df.groupby("item", as_index=False)["diff"].min() 但是,如果我的列多于这两列,则其他列(例如,在我的示例中为 otherstuff)将被删除.我可以使用 groupby 保留这些列,还是必须找到不同的方法来删除行? 我的数据看起来像: ..
发布时间:2021-12-03 08:50:49 Python

Pandas GroupBy.apply 方法复制第一组

我的第一个问题:我对 Pandas (0.12.0-4) 中 groupby 的 apply 方法的这种行为感到困惑,它似乎将函数 TWICE 应用于数据框的第一行.例如: >>>从熊猫导入系列,数据帧>>>将熊猫导入为 pd>>>df = pd.DataFrame({'class': ['A', 'B', 'C'], 'count':[1,0,2]})>>>打印(df)班级数0 一 11 乙 ..
发布时间:2021-12-03 08:33:57 Python

将 Pandas GroupBy 输出从 Series 转换为 DataFrame

我从这样的输入数据开始 df1 = pandas.DataFrame( {"姓名": ["爱丽丝", "鲍勃", "马洛里", "马洛里", "鲍勃", "马洛里"] ,“城市":[“西雅图"、“西雅图"、“波特兰"、“西雅图"、“西雅图"、“波特兰"] } ) 打印时显示如下: 城市名称0 西雅图爱丽丝1 西雅图鲍勃2 波特兰马洛里3 西雅图马洛里4 西雅图鲍勃5 波特兰马洛里 分组很 ..
发布时间:2021-12-03 08:31:07 Python

基于groupby拆分pandas数据框

我想根据列 ZZ 拆分以下数据框 df =N0_YLDF ZZ MAT0 6.286333 2 11.6690691 6.317000 6 11.6690692 6.324889 6 11.5164543 6.320667 5 11.5164544 6.325556 5 11.5164545 6.359000 6 11.5164546 6.359000 6 11.5164547 6.361111 ..
发布时间:2021-12-03 08:30:57 Python

Pandas 中的聚合

如何使用 Pandas 进行聚合? 聚合后没有 DataFrame!发生了什么? 我如何主要聚合字符串列(到 lists、tuples、strings with separator)? 如何汇总计数? 如何创建由聚合值填充的新列? 我已经看到这些反复出现的问题,这些问题询问了 Pandas 聚合功能的各个方面.今天关于聚合及其各种用例的大部分信息都分散在数十个措辞恶劣、无法搜索的帖子 ..
发布时间:2021-12-03 08:23:30 Python