pandas-groupby相关内容
我有一个沿一维具有多个坐标的xarray。在下面的示例中,坐标a和b是沿着维度dim1定义的。我如何groupby使用沿相同维度定义的两个坐标?与this question不同,我不是尝试沿着不同的维度分组,而是沿着单个维度进行分组。 import xarray as xr d = xr.DataArray([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11
..
我有一个数据帧,如下所示: -------------------------------------------------------------------- |TradeGroup | Fund Name | Contribution | From | To | | A | Fund_1 | 0.20 | 2013
..
我正在尝试用python按月分组一些数据,但是我需要每个月的25号开始,有没有办法在Pandas中做到这一点? 几个星期以来,有一种方法可以从周一、周二开始……但有几个月总是满月。 pd.Grouper(key='date', freq='M') 推荐答案 我准备了以下测试数据帧: Dat Val 0 2017-03-24 0 1 2017-0
..
我有这套 df = pd.DataFrame({'user':[1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,4], 'date':['1995-09-01','1995-09-02','1995-10-03','1995-10-04','1995-10-05','1995-11-07','1995-11-08','1995-11-09','
..
我有一个数据,其中包含周号、帐户ID和几个使用情况列。我希望a)按帐户ID分组,b)将每周数据重新采样为每日数据,以及c)均匀内插每日数据(将每周数据除以7),然后将其全部组合在一起。我已经记下了大部分,但是 pandas groupby让我有点迷惑。它也非常慢,这让我认为这可能不是最佳解决方案。 数据如下: Account Id year week view
..
我有一个数据帧,如下所示: Col1 Price 1 Plastic 50 2 Metal 100 3 Plastic 40 我想用它们在Price中的平均值替换col1中的值,因此我得到: Col1 Price 1 45
..
我正在尝试基于目标GROUP-BY";列在我的数据框上使用字符串创建一些聚合。 假设我有以下4列数据帧: 我要基于列";col1";对所有行进行分组,在此情况下,使用非NULL值进行分组。 所需输出如下: 我还尝试使用正常: import pandas as pd from tabulate import tabulate df = pd.D
..
给定以下 pandas 数据帧: timestamp 0 2018-10-05 23:07:02 1 2018-10-05 23:07:13 2 2018-10-05 23:07:23 3 2018-10-05 23:07:36 4 2018-10-05 23:08:02 5 2018-10-05 23:09:16 6
..
我有一个如图所示的数据帧,我希望在不更改顺序的情况下将其转换为多行。 RESP HR SPO2 PULSE 1 46 122 0 0 2 46 122 0 0 3 4 推荐答案 一种可能解决方案是使用reshape,仅需要的列长模数为0(因此可以将所有数据转换为4列DataFrame): df1 = pd.Dataframe(df.va
..
我有以下数据帧: import pandas as pd array = {'id': [1, 1, 1, 2, 2, 2, 3, 3], 'A': [False, False, True, False, False, False, True, True], 'B': [False, True, True, False, True, False, False, False]
..
我有数据帧,我在代码中将其引用为df,并且我在每个组的多个列上应用聚合函数。我还应用了用户定义的lambda函数f4, f5, f6, f7。有些函数非常相似,比如f4, f6和f7,只是参数值不同。我是否可以从字典d传递这些参数,以便我只需编写一个函数,而不是编写多个函数? f4 = lambda x: len(x[x>10]) # count the frequency of beari
..
我搜索了stackoverflow以了解如何按月对日期时间进行分组,但由于某些原因,我一直收到此错误,即使我通过pd.to.datetime 传递了数据帧之后也是如此 TypeError:仅对DatetimeIndex、TimedeltaIndex或 PerodIndex,但获取了“Int64Index”的实例 df['Date'] = pd.to_datetime(df['Date']
..
我有这样的 pandas 数据帧: d = {'dollar_amount': ['200.25', '350.00', '120.00', '400.50', '1231.25', '700.00', '350.00', '200.25', '2340.00'], 'date': ['22-01-2010','22-01-2010','23-01-2010','15-02-2010','2
..
我有如下所示的数据帧 df = pd.DataFrame({'person_id': [101,101,101,101,202,202,202], 'login_date':['5/7/2013 09:27:00 AM','09/08/2013 11:21:00 AM','06/06/2014 08:00:00 AM','06/06/2014
..
我有一个包含11列的数据帧,其中date是一个索引。我正在尝试使用列total的滚动平均值创建一个新列。但是,我收到错误:TypeError:插入列的索引与框架索引不兼容 import pandas as pd df = pd.DataFrame({ 'date':['2016-04-01','2016-05-01','2016-07-01','2016-08-01','2016-
..
data = {'groupId':[1,1,2], 'email':['a1@gmail.com', 'a2@gmail.com', 'a3@gmail.com'], 'type':['office','personal','personal'],'name':['santy','santy','will']} df = pd.DataFrame(data) 我有一个这样
..
我有一个 pandas 数据帧,如下所示: KEY START END VALUE 0 A 2017-01-01 2017-01-16 2.1 1 B 2017-01-01 2017-01-23 4.3 2 B 2017-01-23 2017-02-10 1.7 3 A 2017-01-28
..
我一直在试着从大 pandas 的Groupby物体上得到一个累加。我需要将累加移位1,这是通过Shift()实现的。但是,在单个GROUPBY对象上同时执行这两个函数会产生一些不需要的结果: df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2], 'B': [2, 3, 5, 2, 3, 5]}) df.groupby
..
我有一个简单的dataframe df,其中有一列列表lists。我想根据lists生成一个附加列。 df如下所示: import pandas as pd lists={1:[[1]],2:[[1,2,3]],3:[[2,9,7,9]],4:[[2,7,3,5]]} #create test dataframe df=pd.DataFrame.from_dict(lists,orie
..
假设我有以下数据示例: df = pd.DataFrame({'date':['2011-01-01','2011-01-02', '2011-01-03','2011-01-04','2011-01-05', '2011-01-06','2011-01-07','2011-01-08',
..