dataframe相关内容

Spark:将DataFrame写为压缩的JSON

Apache Spark的 DataFrameReader.json()可以自动处理gzip压缩的JSONlines文件,但似乎没有办法得到 DataFrameWriter.json ()来编写压缩的JSONlines文件。 有没有办法解决这个问题? 解决方案 以下解决方案使用pyspark,但我认为Scala中的代码类似。 第一个选项是设置以下当你初始化你的SparkConf ..

测试数据帧是否是另一个数据帧的排序版本

测试某个数据帧是否只是另一个数据帧的排序版本是否可行?例如,如果我有两个数据帧 a 和 b ,是否有一些方法可以轻松确定 a 只是 b 的重新排序版本(反之亦然)? 这里有一个简单的例子: a b 我能想到的最接近的事情是 all.equal ,但它的输出是没有帮助的(至少对我来说): > all.equal(a,b) [1]“属性: ..
发布时间:2016-12-21 22:21:58 其他开发

R闪亮的彩色数据帧

我有一个资料框架: runApp( list(ui = bootstrapPage(pageWithSidebar( headerPanel(“具有颜色的数据帧”), sidebarPanel(), mainPanel( tableOutput(“my_dataframe”) ) ) ) , server = function(input,output){ output $ ..
发布时间:2016-12-17 22:11:17 其他开发

在R中从列表转换为data.frame时,utf-8字符丢失

我使用R 3.2.0与RStudio 0.98.1103在Windows 7 64位。我的电脑的Windows“区域和语言设置”是英语(美国)。 由于某种原因下面的代码替换了我的捷克字符“č”在文本“Koryčanynadpřehradou”中,通过“c”和“r”,当我从web中读取utf-8编码的XML文件时,将XML文件解析为列表,并将列表转换为data.frame。 库(XML) ..
发布时间:2016-11-19 15:06:18 其他开发

R - 从data.frame中舍弃双精度向量

我有这个问题使用 read.table()有或没有 header = T ,试图提取从 data.frame 与 as.double(as.character())(见?factor )。 但这只是如何我意识到,逻辑。因此,您不会看到 read.table 在下面的代码中,只有必要的部分。 使用 header = T 等价: (a ..
发布时间:2016-11-18 16:57:29 其他开发

在R中的数据帧中的两个字符之间添加空格

我有一个数据框,其中每个单元格是2个字符串(即:“AA”,“BC”,“CD”),其中我试图在每个两个字符之间放置空格,是。我似乎不明白这一点。任何帮助???? 以下是示例数据框: df 这是示例数据框架的样子: / p> col1 col2 col3 1 AB AA XX 2 CD BB YY 3 EF CC ; NA> 这是我 ..
发布时间:2016-11-18 16:48:26 其他开发