multi-index相关内容
鉴于此多索引数据帧, Units Import Export Date 01012019 01022019 02012019 02022019 03012019 03022019 01012019 01022019
..
假设您有以下半MultiIndex object import pandas as pd df = pd.DataFrame({ 'c': { ('r', 'r1'): 1., ('r', 'r2'): 2., }, }) print(df) # c # r r1 1 # r2 2 让我们重点关注分层索引,即垂直索引。首
..
这是我正在处理的DataFrame的示例: import pandas as pd import numpy as np from scipy.stats import zscore df = pd.DataFrame( index=pd.MultiIndex.from_tuples( [('Monday', '2019-11-04'),('Monday', '2019-
..
我有以下代码: import pandas as pd from pandas import DataFrame as df import matplotlib from pandas_datareader import data as web import matplotlib.pyplot as plt import datetime import warnings warnings.f
..
目标是根据列(A和B)的条件创建一个新的多索引列(stat) A的条件 CONDITION_A='n'if A
..
我的数据帧如下: Tahun Jan Feb Mar Apr Mei Jun Jul Ags Sep Okt Nov Des 0 2020 0.39 0.28 0.10 0.08 0.07 0.18 -0.10 -0.05 -0.05 0.07
..
我有一个如下所示的df: pid time id vid id1 vis_id1 pid1 t_0 vis_id1 pid2 t_1 id2 vis_id2 pid1 t_3
..
我当前有以下聚合的数据帧,并且我有一个多索引,如下所示: Date Country_Band Value Decimal May 2021 Non-US 2-14 0.11 US 2-14 0.22 1
..
我有一个多索引DataFrame,并且我希望仅对分配给我的一个级别的向量应用一些计算。 使用以下代码: import pandas as pd import datetime ticker_date = [('US',datetime.date.today()-datetime.timedelta(3)), ('US',datetime.date.today()-datetime.ti
..
我有一个多索引数据帧,如下所示: PID Fid x y A 1 2 3 2 6 1 3 4 6 B 1 3 5 2 2 4 3 5 7 我想删除每个患者具有最高x值(P
..
我想做这样的事情: df = pd.DataFrame() for row_ind1 in range(3): for row_ind2 in range(3:6): for col in range(6:9): entry = row_ind1 * row_ind2 * col df.loc[[row_ind1, ro
..
我有一个下面的数据帧,它将被进一步处理以创建数据透视表。现在,我正在尝试在Ploly中绘制多指标透视表数据。但在PLOTLY中,不知何故它没有采用这些值并显示错误。 我需要在x轴上绘制类别‘Development’和‘Developing’,并绘制与这些类别相关的数据。关联的“员工”数据应绘制在每个类别中。‘Y轴必须是’gdp‘,堆栈条必须是’cond_cat‘。下面是供参考的代码。 示例
..
我在重塑和查询我在 pandas DataFrames中的数据时使用的是Lot of方法链。有时会为in索引(行)和列创建额外的和不必要的级别。如果是,例如在索引(行轴)上,可以使用DataFrame.reset_index(): 轻松解决 df.query('some query') .apply(cool_func) .reset_index('unwanted_index_l
..
我有一个以下格式的数据帧: a b x 1 1 31 1 2 1 1 3 42 1 4 423 1 5 42 1 6 3 1 7 44 1 8 65437 1 9 73 2 1 5656 2 2 7 2 3 5 2 4 5 2 5 34 a和b是索引,x是值。 我
..
如何编辑多索引数据框的值?如果它是非多索引数据帧,我知道我可以这样做:df.at[0,'foo'] = 12.3。 此外,这也不起作用:df.loc[0]['foo']['a'] = 12.3。 考虑多索引列数据帧。 colnames = [ ['foo', 'foo', 'foo', 'po', 'po', 'po', 'di', 'di', 'di'], ['a',
..
我有两个以多个索引和日期为一列的数据帧: df1 df1 = pd.DataFrame.from_dict({('group', ''): {0: 'A', 1: 'A', 2: 'A', 3: 'A', 4: 'A', 5: 'A', 6: 'A', 7: 'A', 8: 'B', 9: 'B', 10: 'B', 11: 'B', 1
..
我有一个MongoDB开发集群,作为开发改进的一部分,我会在其中创建索引。在测试/生产MongoDB集群时,我也希望维护相同的索引。 如何获取现有集合的所有索引并在新数据库上创建相同的集合索引? 推荐答案 从Mongo Shell切换到要从中收集索引的数据库 第1步:切换到现有数据库并在脚本下运行 > use my_existing_db 下面的脚本循环遍历所有
..
我有一个现有的DataFrame,如下所示: 1 | 1 | 1 | 2 | 2 | 2 | 2 -------------------------------------------------------- | abc | def | ghi | jkl | mno | pqr | stu | 1
..
我有一个多=索引的DataFrame,但我希望每个级别1只保留两列,用于每个级别0变量(即列‘1’和‘2’)。我可以单独设置它们的子集,但我想一起设置子集,这样我就可以并排保留这些值 这是DataFrame index = pd.MultiIndex.from_tuples(list(zip(*[['bar1', 'foo1', 'bar1', 'foo2','bar3','foo3'
..
有没有人知道是否可以使用DataFrame.loc方法从MultiIndex中进行选择?我有以下DataFrame,并且希望能够访问位于('at', 1)、('at', 3)、('at', 5)等索引(非顺序)的Dwell列中的值。 我希望能够执行类似data.loc[['at',[1,3,5]], 'Dwell']的操作,类似于常规索引的data.loc[[1,3,5], 'Dwell']
..