dataframe相关内容

R:data.frame的聚合列

我有一个数据框架,看起来像这样 >头(df) 内存内存内存内存内存天真 10472501 6.075714 5.898929 6.644946 6.023901 6.332126 8.087944 7.520194 10509163 6.168941 6.495393 5.951124 6.052527 6.404401 7.152890 8.335509 10496091 10. ..
发布时间:2017-03-26 01:35:08 其他开发

如何从熊猫数据框中删除方括号

在应用 str.findall()后,我提出了方括号中的值(更像是一个列表)到大熊猫数据帧的列。如何删除方括号? print df id value 1 [ 63] 2 [65] 3 [64] 4 [53] 5 [13] 6 [34] 解决方案 如果列值键入列表,使用: df ['value'] = df ['value']。str ..
发布时间:2017-03-26 01:34:56 Python

使用plyr :: mapvalues与dplyr

plyr :: mapvalues 可以这样使用: mapvalues(mtcars $ cyl,c(4,6,8),c(“a”,“b”,“c”)) 但这不行: mtcars%>% dplyr :: select(cyl)%>% mapvalues(c(4,6,8),c(“a”,“b”,“c”))%>% as。 data.frame() 如何使 ..
发布时间:2017-03-26 01:33:46 其他开发

使用Inf和NaN在R中删除行

我有以下数据: > dat ID基因值1 Value2 1 NM_013468 Ankrd1 Inf Inf 2 NM_023785 Ppbp Inf Inf 3 NM_178666 Themis NaN Inf 4 NM_001161790 Mefv Inf Inf 5 NM_001161791 Mefv Inf Inf 6 NM_019453 Mefv Inf ..
发布时间:2017-03-26 01:33:34 其他开发

缓慢的data.frame行分配

我正在使用RMongoDB,我需要使用查询的值填充一个空的data.frame。结果相当长,大约有2万个文件(行)。 在进行性能测试时,我发现将值写入行的时间会随着数据帧的维数而增加。也许这是一个众所周知的问题,我是最后一个注意的问题。 一些代码示例: set.seed(20140430) nreg ..
发布时间:2017-03-26 01:33:06 其他开发

总结每天大熊猫的发生次数

分数 时间戳 2013 -06-29 00:52:28 + 00:00 -0.420070 2013-06-29 00:51:53 + 00:00 -0.445720 2013-06-28 16:40:43+ 00:00 0.508161 2013-06-28 15:10:3​​0 + 00:00 0.921474 2013-06-28 15:10:17 + 00:00 0.87 ..
发布时间:2017-03-26 01:32:54 Python

如何从内存中删除多个大熊猫(python)数据帧以保存RAM?

我有很多数据帧是作为预处理的一部分而创建的。由于我有限制的6GB RAM,我想从RAM中删除所有不必要的数据帧,以避免在scikit学习中运行GRIDSEARCHCV时内存不足。 1)是否有一个仅列出的功能,当前加载到内存中的所有数据帧? 我尝试过dir(),但它提供了除数据框之外的许多其他对象。 2)我创建了要删除的数据框列表 del_df = [Gender_dumm ..
发布时间:2017-03-26 01:32:42 Python

在Pandas Dataframe的行上求和

我有一个DataFrame的记录,看起来像这样: stocks = pd.Series(['A' 'A','B','C','C'],name ='stock') 位置= pd.Series([100,200,300,400,500],name ='positions' ) same1 = pd.Series(['AA','AA','BB','CC','CC'],name ='same1' ..
发布时间:2017-03-26 01:32:30 Python

尝试将日志方法应用于Python中的熊猫数据框列时出错

所以,我对Python和熊猫(和一般的编程)非常新鲜,但是在看似简单的功能方面遇到麻烦。所以我使用SQL查询拉出的数据创建了以下数据框(如果你需要查看SQL查询,让我知道,我会粘贴) spydata = pd.DataFrame(row,columns = ['date','ticker','close','iv1m','iv3m']) tickerlist = unique(spyda ..
发布时间:2017-03-26 01:32:19 Python

当字符串列的内容长于那些时,HDFStore.append(string,DataFrame)失败

我有一个通过HDFStore存储的Pandas DataFrame,它基本上存储有关我正在做的测试运行的汇总行。 每行中的几个字段包含描述性字符串可变长度。 当我进行测试运行时,我创建一个新的DataFrame,其中包含一行: def export_as_df(self): return pd.DataFrame(data = [self._to_dict()],index ..
发布时间:2017-03-26 01:31:56 Python

从Panda的datetime< [M8]中删除时间

所以我的数据框中有一个'日期'列,日期格式如下 0 1998- 08-26 04:00:00 如果我只想要年份月份和日子我该如何下降简单的小时? 解决方案 最快的方法是使用DatetimeIndex的normalize(你首先需要使列为DatetimeIndex): 在[11]中:df = pd.DataFrame({“t”:pd.date_range(' ..
发布时间:2017-03-26 01:31:45 Python

将命名元素的列表转换为数据帧或数据表

我有一些名称元素的列表( testlist ),其中一些名称被复制 $ x [1]“一” $ x [1]“两” $ y [1]“三” $ y [1]“四” 我试图找到一个数据表,它将通用名称的元素组合到同一列中。 xy 1:一个三 2:两个四 我尝试过 testdf ..
发布时间:2017-03-26 01:31:21 其他开发