reshape相关内容
我有一个如下所示的数据帧: df = pd.DataFrame({'month':['2017-09-27','2017-09-27','2017-09-28','2017-09-29'],'Cost':[100,500,200,300]}) 如何才能获得这样的df: 2017-09-27 2017-09-28 2017-09-29 100 20
..
我正在尝试将我的长数据重塑为宽格式。数据当前如下所示: OBS . date . TICKER . RET 1 . 20050131 . AAPL . 0.02 2 . 20050231 . AAPL . 0.01 3 . 20050131 . GOOG . 0.05 4 . 20050231 . GOOG . 0.03 我希望获得如下数据: TICKER . 20050131
..
我有一个带有元组列表的列,希望将此元组转换为新列。(注意:必须使用Pandas 0.21;由于我的项目要求,无法升级。)请参见下面的示例: df = pd.DataFrame(dict(a=[1,2,3], b=['a', 'a', 'b'], c=[[('pear', 1), ('apple', 2)], [('pea
..
我有以下数据库(宽形式)“st_all”,其中有两个我希望重塑的变量(“P”和“PLC”)。受试者的ID是“g_id”。 g_id study condition sample PLC1 PLC2 PLC3 PLC4 PLC5 PLC6 PLC7 PLC8 PLC9 PLC10 P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 1 1 1 1
..
我有一个名为a的数值int32数组,其形状为(4, 8, 3)。我想将此数组重塑为(4, 12, 3)大小的数组。我该怎么做? 我已尝试使用reshape,但reshape要求数组大小相同。 推荐答案 我可能错了,但是:Numy数组不应该以这种方式变异。 当您进行重塑时,实际上只是更改了读取字节/元素的顺序/方式 您要做的是创建一个更大的新数组,它包含前一个数组的数据以及其他内
..
我以前运行的代码在调用dcast公式时崩溃了。在尝试之后,我发现即使是来自dcast帮助页面的最小示例也不再适用于我。更准确地说: #Air quality example names(airquality)
..
我遇到了一个需要重塑的不寻常的数据集,但正常的重塑/tidyr包似乎没有办法解决它。虽然可以使用子设置和rbind重塑数据集,但必须有更直接的方法来解决此问题。 数据集如下所示: ID Item.1 Item.1.Value Item.2 Item.2.Value Item.3 Item.3.Value 001 A 3
..
我有一个大型数据集,我需要将其从宽格式转换为长格式。这应该很简单,这个论坛上有很多如何做到这一点的例子。但是,在本例中,我还需要拆分宽格式中使用的列标题,并为每个长格式的列创建一列。 示例数据集 data
..
具有如下所示的拷贝数长格式,其中每个样本在其自己的基因组范围内有其自己的拷贝数值(SegVal) > head(long) chromosome start end segVal sample 1: chr1 3218923 116319008 2 TCGA-05-4417-01A-22D-185
..
data是一维数据数组。 data = [0.0, 7000.0, 0.0, 7000.0, -400.0, 0.0, 7000.0, -400.0, -7400.0, 7000.0, -400.0, -7000.0, -7000.0, 0.0, 0.0, 0.0, -7000.0, 7000.0, 7000.0, 7000.0, 0.0, -7000.0, 6600.0, -7400.0,
..
我有一个数据集,其中一列包含多个值,用;分隔。 name sex good_at 1 Tom M Drawing;Hiking 2 Mary F Cooking;Joking 3 Sam M Running 4 Charlie M Swimming 我希望为good_at中的每个唯一值创建一个虚拟变量,这样每个虚
..
我需要将个人每年重复测量的“宽”数据帧转换为“长”格式,以便我可以将其建模为lm(y_Year 2~x_Year 1)和lm(z_Year 2~y_Year 2) 我可以“手动”将其转换为我想要的格式,但不知道如何melt/dcast将其转换为我想要的形状 下面我演示了如何处理一些模拟数据 数据帧格式如下,每行一个 ID SITE L_03 M_03 R_03
..
我也在研究类似的问题,但我找不到与我的案例类似的案例。我有一个数据框,对于每个受试者,每个条件都有多个观察结果。如下所示: subject
..
我有一个维度数组(40 X 40 X 8064),它对应于(视频X频道X数据)。 但现在我想按如下顺序将数组转换为数据框: Index | Video | Channel_0 | Channel_1 | Channel_2 | .... | Channel_39 0 | 0 |[Some Value] |[Some Value] |[Som
..
我目前正在处理“长”形式的多态分析数据集(每个人的观察结果占一行;每个人最多重复测量5次)。 其思想是每个个体可以在时变的状态变量s = 1, 2, 3, 4的级别之间递归转换。我拥有的所有其他变量(这里cohort)在任何给定的id内都是固定的。 经过一些分析后,我需要根据访问过的州的特定顺序,以“宽”的形式重塑数据集。以下是初始长数据的示例: dat
..
我有一个这样的.csv文件: +-------+---------+------+-------+ | CONN | TABLE | COLS | OWNER | +-------+---------+------+-------+ | ONE | TABLE_A | 10 | MIKE | | ONE | TABLE_B | 9 | MIKE | | ONE
..
我正在尝试在我闪亮的Web应用程序中创建一种透视表,用户可以在其中选择他们想要对彼此进行强制转换的变量。我发现的问题是,当我尝试将CAST与我的‘INPUT$COLUMNS’一起使用时,我得到以下结果:错误:强制转换公式包含在熔化数据中找不到的变量:INPUT$COLUMNS。输入$COLUMNS应该是在我的数据集中找到的三个列名之一,所以我不确定问题可能是什么。我附加了代码的简化版本,以尝试隔离
..
我正在尝试使用熔化公式将数据框从宽格式转换为长格式。挑战在于我有多个标签相同的列名。当我使用MILL函数时,它会从重复列中删除值。我读过类似的问题,有人建议我使用重塑功能,但我无法让它工作。 要复制我的起始数据框: conversion.id
..
我的数据如下所示: ID X1 X2 X3 1 1.4 2 two 2 7.6 30 thirty 2 7.6 50 fifty 2 7.6 40 forty 3 5.6 40 forty 3 5.6 50 fifty 4 3.5 NA NA 5 NA 2 t
..
我有一个数据框,如下所示: df1=pd.DataFrame(np.arange(24).reshape(6,-1),columns=['a','b','c','d']) 我想取3组行,并按以下顺序将它们转换为列 块状重塑未给出预期答案 pd.DataFrame(np.reshape(df1.values,(3,-1)),columns=['a','b','c','d','e
..