pandas相关内容
我想转换以下数据框: ID 1234 type band category 0 A B C 收件人: ID type band category 1234 A B C 其中ID是索引列 推荐答案 尝试 df.stack(0).reset_index().drop(
..
我有按年统计的销售额: pd.DataFrame({'year':[2015,2016,2017],'value':['12','24','30']}) year value 0 2015 12 1 2016 24 2 2017 36 我要外推到月份: yyyymm value 201501 1 (ie 12/12, etc) 20150
..
我有一个df: import pandas as pd df = pd.DataFrame({"A": [1, 3, 7, 10], "B": [2, 5, 8, 11], "C": list("WXYZ") }) print(df) >>> A B C >>>0 1 2 W >>>1 3 5 X >>>2 7 8 Y >>>3 10 11
..
我在重塑 pandas 数据帧方面有一个问题。如下所示(行数和列数各不相同): columns col1 col2 col3 col4 Species sp1 218.000000 521.000000 533.000000 793.00
..
我有一个如下所示的数据帧: df = pd.DataFrame({'month':['2017-09-27','2017-09-27','2017-09-28','2017-09-29'],'Cost':[100,500,200,300]}) 如何才能获得这样的df: 2017-09-27 2017-09-28 2017-09-29 100 20
..
我正在尝试将我的长数据重塑为宽格式。数据当前如下所示: OBS . date . TICKER . RET 1 . 20050131 . AAPL . 0.02 2 . 20050231 . AAPL . 0.01 3 . 20050131 . GOOG . 0.05 4 . 20050231 . GOOG . 0.03 我希望获得如下数据: TICKER . 20050131
..
我有一个带有元组列表的列,希望将此元组转换为新列。(注意:必须使用Pandas 0.21;由于我的项目要求,无法升级。)请参见下面的示例: df = pd.DataFrame(dict(a=[1,2,3], b=['a', 'a', 'b'], c=[[('pear', 1), ('apple', 2)], [('pea
..
我有一个维度数组(40 X 40 X 8064),它对应于(视频X频道X数据)。 但现在我想按如下顺序将数组转换为数据框: Index | Video | Channel_0 | Channel_1 | Channel_2 | .... | Channel_39 0 | 0 |[Some Value] |[Some Value] |[Som
..
我有一个数据框,如下所示: df1=pd.DataFrame(np.arange(24).reshape(6,-1),columns=['a','b','c','d']) 我想取3组行,并按以下顺序将它们转换为列 块状重塑未给出预期答案 pd.DataFrame(np.reshape(df1.values,(3,-1)),columns=['a','b','c','d','e
..
我有一个 pandas 数据框,如下所示: request_id crash_id counter num_acc_x num_acc_y num_acc_z 745109.0 670140638.0 0 0.010 0.000 -0.045 745109.0 670140638.0
..
我有一个数据集,如下所示: Value Type mean -1.975767 Weather -0.540979 Fruits -2.359127 Fruits -2.815604 Corona -0.929755 Weather 我要迭代每一行并计算上面每一行的平均值(仅当Type匹配时)。我想将此值放在平均值
..
我有一个数据集,如下所示: Value Type X_sq -1.975767 Weather -0.540979 Fruits -2.359127 Fruits -2.815604 Corona -0.929755 Weather 我想遍历每一行,并计算上面每一行的平方和(仅当Type匹配时)。我想将此值放在X.
..
我有一个数据框,里面有2014-2018年的客户ID和他们的费用。我想要的是每个ID的费用的平均值,但在计算平均值时,只能考虑某个日期之前的年份(因此,列‘Date’表示可以考虑哪些列作为平均值)。 例如:对于索引0(ID:12),日期为‘2016-03-08’,则平均值应取自列‘y_2014’和‘y_2015’,因此对于此索引,平均值为111.0。如果日期太早(例如,在这种情况下为2014年或
..
我有一个类似于此的CSV文件 Date,Temp1,Temp2 23-Oct-09 01:00:00,21.1,22.3 23-Oct-09 04:00:00,22.3,23.8 23-Oct-09 07:00:00,21.4,21.3 23-Oct-09 10:00:00,21.5,21.6 23-Oct-09 13:00:00,22.3,23.8 23-Oct-09 16:0
..
我使用的是Windows机器和WSL2(Ubuntu 20.04.1LTS)。在我的Linux子系统中,我集成了Anaconda并创建了一个pypy3.6环境。我安装了一些没有问题的包,比如networkx和NumPy,但我不能集成 pandas 。我知道 pandas 可能会更慢,这个项目我不能没有它。 我使用pypy -mpip install pandas 这是产生的错误:
..
考虑两个数据帧df_a和df_b: >>> df_a = pd.DataFrame.from_dict({1: [1,2,3], 2: ["a", "b", "c"], 3:[4,5,6]}) >>> df_a.index = pd.Index([0,1,3]) >>> print(df_a) 1 2 3 0 1 a 4 1 2 b 5 3 3 c 6 >>>
..
我有一个如下所示的函数,并在for循环中运行它: def findInfo(url, df): allLinks = getAllLinks(url) katalogLinks = getKatalogLinks(allLinks) if len(katalogLinks) == 0: df = df.append({'Company URL' : u
..
我有以下df: id step1 step2 step3 step4 .... stepn-1, stepn, event 1 a b c null null null 1 2 b d f null null null 0 3 a d
..
我有日志文件,其中有很多行,格式为: LogLevel [13/10/2015 00:30:00.650] [Message Text] 我的目标是将日志文件中的每一行转换为漂亮的数据框。我已经试着这样做了,通过在[字符上拆分行,但是我仍然没有得到一个整齐的数据帧。 我的代码: level = [] time = [] text = [] with open(
..
如何在python代码中实现R的Case_When函数? 以下是R:的Case_When函数 https://www.rdocumentation.org/packages/dplyr/versions/0.7.8/topics/case_when 作为最小的工作示例,假设我们有以下数据帧(以下是python代码): import pandas as pd import n
..