dataframe相关内容

Rcpp:使用Rcpp(内联)的数据帧时推荐的代码结构

[我已将此草稿作为其他地方的评论,但决定创建一个正确的问题...] 目前被认为是“最佳实践”在Rcpp中使用数据帧时的代码结构?可以将输入数据帧从R转换到C ++代码的难易程度是显而易见的,但是如果数据帧具有n列,则是当前的想法,即该数据应当被分成n个单独的C ++)向量之前使用? 在使用数据框架中的字符串是的,这是正确的事情。特别地,似乎不支持诸如df.name [i] 的符号直接引 ..
发布时间:2016-10-24 16:33:47 C/C++开发

选择Deedle特定的行

我有一个deedle数据帧,称为DF,用指定的列 TimeSpent 之一。 我想保持行,其中有 TimeSpent 不是特定的时间内(如30分钟),更大的价值。 我只能设法保持行与特定时间内(30分钟)使用 FilterRowsBy() DF = df.FilterRowsBy< INT,字符串,时间跨度>(“TimeSpent”,新的时间跨度(0,30,0 )); ..
发布时间:2016-10-10 19:23:22 C#/.NET

在deedle框更改列顺序

什么是改变deedle框架柱秩序的最佳途径?例如,如果我有一个deedle帧东风的列高度,名称和电话,但我需要它,以名称,电话和高度。 解决方案 Deedle具有的 RealignRows 扩展方法,但事实证明,我们没有 RealignColumns 。这是一个疏忽,如果你发送一个公关Deedle添加此,这将是真棒! 它可以通过查看该系列列,重新调整列实施并把该回的数据帧。在C#中, ..
发布时间:2016-10-01 20:11:28 C#/.NET

错误:一个系列的真值是模糊的。蟒蛇和放大器;熊猫

我试图找出所有的MSFT和GOOG的期权合约有超过10,000批量的一天,并打印出symbol.I的名称正在错误“系列的真值是不明确。使用a.empty,a.bool(),a.item(),a.any()或a.all()“。该错误是第13行任何帮助是极大的AP preciated。 从pandas_datareader.data导入选项 进口大熊猫作为PD 从熊猫进口数据框 进口日期时间代号= ..
发布时间:2016-06-03 21:29:24 Python

从其他数据类型命名列和行名中的R

我有一个这样的数组: &GT; COLUMNNAMES [1]贸易籽粒粗玉米小麦船兴趣ACQ赚取money.fx &GT;摘要(COLUMNNAMES) ACQ玉米粗赚取利息粮船money.fx小麦贸易 1 1 1 1 1 1 1 1 1 1 &GT; STR(COLUMNNAMES) 系数W / 10级“ACQ”,“玉米”,“粗”,..:9 5 3 2 8 10 1 6 7 4 和 ..
发布时间:2016-06-03 21:27:17 其他开发

在大熊猫/蟒蛇,读阵列存储为字符串

我有一个熊猫数据框,其中的一列具有字符串作为每个元素的数组。 所以,这样的事情。 COL1 COL2 0 120'ABC','高清'] 1 130'GHI','荷航'] 现在,当我使用这个它to_csv似乎罚款保存为csv。 当我使用from_csv读回我似乎读回。 但后来当我在每个单元格分析值数组 '['''''A''B''C'等。 所以基本上它不是阅读它作为一个数组,但一组字符串。有 ..
发布时间:2016-06-03 10:33:33 Python

如何获得平均数,中位数,和其他在整个矩阵,数组或数据帧的统计数据?

我知道这是一个基本的问题,但由于某种奇怪的原因,我无法找到答案。 我应该如何运用基本的统计功能,如平均值,中位数等在整个阵列,矩阵或数据框获得独特的答案,而不是过度的行或列向量 解决方案 由于这来了一个公平一点,我打算把这个多一点COM prehensively,包括了“等等。”片中除了平均值和中位数。 对于一个矩阵或数组,因为其他人说,的意思是和中位数将返回单个值。然而, VAR ..
发布时间:2016-05-30 22:32:50 其他开发

如何数据帧列的名称从字符串转换为适合(qplot,GGPLOT2)参数呢?

我想编写一个函数,它接受一个数据帧和图形在数据帧的直方图的所有列。 对于数据帧的列名我事先知道,我可以写 qplot(colname1,数据= DF,GEOM ='直方图') qplot(colname2,数据= DF,GEOM ='直方图') ... 但我想这样做一般,这样我可以使用列的名称作为一个字符串“colname1”。 在换句话说,怎样写 plot_histogram_of_c ..
发布时间:2016-05-29 12:01:46 JavaScript

如何基于其他列的值,以大熊猫数据框列追加

我有以下问题:我想追加列一个数据帧。这些列在这个数据帧的另一行的唯一值,充满了此行的这个值的发生。它看起来是这样的: DF: 列1列2 0 1,B,C 1 2 A,E 2 3 3 4 C,F 4 C,F 我想获得的是:列1列2 A B C电子网 0 1,B,C 1 1 1 1 2 A,E 1 1 2 3 1 3 4 C,F 1 1 4 C,F 1 1 (空的空间可以是男或0,这并不 ..
发布时间:2016-05-25 21:38:50 Python

在带有R 1 .csv文件编写不同的数据帧

我有3个数据帧,我希望他们写在一个单一的.csv文件,一个是上面的人,而不是在同一个表。因此,在一个CSV文件中3个不同的表。它们都具有相同的尺寸。 与 write.csv 问题:它不包含“追加的”功能 这个问题 write.table :从 write.table 不被读取pttily $ P $的CSV文件Excel 2010中像那些从 write.csv 帖子我已经阅读并在其中我无 ..
发布时间:2016-05-25 21:37:02 其他开发

如何追加行R的数据框

我环顾四周,计算器,但我不能找到具体的我的问题,这涉及到追加行R的数据框的解决方案。 我初始化一个空的2列的数据帧,如下: DF = data.frame(X =数字(),Y =字符()) 然后,我的目标是通过值列表进行迭代,并且在每次迭代中,一个值追加到列表的末尾。我开始用下面的code。的(我在1:10){ DF $ X = rbind(DF $ X,I) DF $ ..
发布时间:2016-05-25 21:23:30 其他开发

我怎样才能prevent rbind()从歌厅的数据框变大很慢?

我只有1行中的数据帧。对此我开始使用rbind添加行 DF只有一行#mydataframe 为(i的1:20000) { DF&LT; - rbind(DF,NEWROW)} 这得到,因为我生长非常缓慢。这是为什么?我怎么能做出这种类型的code的更快? 解决方案 您在的第二圈地狱,即未能pre-分配的数据结构。 在这种方式成长的对象是在一个非常非常糟糕的事情R.无论是pr ..
发布时间:2016-05-25 21:20:12 其他开发

R:如何内的重命名一个数据帧的循环?

我要单独运行几个国家的API下载功能。我的变量是我从Excel列表读取字符串。每个观察由三个字母国家标识符标识( codeS [1,1] )。理想情况下,我想做到这一点: codeS = read.xls(“data.xlsx”)为(ⅰ在1:50){ codeS [1,1] = Quandl(C(的toString(codeS [I,2])的toString(codeS [我,3]),的toS ..
发布时间:2016-05-22 20:42:09 其他开发

清单字符串的RDD转换成排

我想有一个字符串的固定大小的列表(解析CSV文件的结果)的RDD转换成和行RDD。这是这样我就可以把它变成一个数据帧,因为我需要它变成一个数据框写入到实木复合地板。反正我需要帮助的唯一部分是RDD从字符串排列表转换。 该RDD变量名是RDD 解决方案 我用: 进口org.apache.spark.sql._ VAL RowRDD = RDD.map(R =&GT; Row.fromSe ..
发布时间:2016-05-22 16:50:31 其他开发

如何将星火数据框添加到另一个数据框的底部?

我可以使用 withcolumn 来新列添加到数据框。但在斯卡拉我怎么能新行添加到数据帧? 我想一个数据帧添加到另一个的底部。因此,无论怎样在斯卡拉或如何将数据帧添加到另一个人会帮的底部添加行。谢谢 解决方案 如果他们有相同的架构,使用简单的 unionAll : VAL dfUnion = df1.unionAll(DF2) ..
发布时间:2016-05-22 16:45:06 其他开发

正确地从文件中读取类型PySpark

我有一个包含行作为一个制表符分隔文件 ID1名1 ['一','B'] 3.0 2.0 0.0 1.0 这是一个id,名称,与某些字符串列表,和一系列的4浮动属性。 我读此文件 RDD = sc.textFile('myfile.tsv')\\ .MAP(拉姆达行:row.split('\\ t')) DF = sqlc.createDataFrame(RDD,架构) 在这里我给 ..
发布时间:2016-05-22 16:30:56 Python