首页
Python
火花数据帧转换为大 pandas / R数据框要求

火花数据帧转换为大 pandas / R数据框要求 [英] Requirements for converting Spark dataframe to Pandas/R dataframe

查看：250 发布时间：2016/5/22 15:28:05 hadoop pandas apache-spark

本文介绍了火花数据帧转换为大 pandas / R数据框要求的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我上运行Hadoop的纱的火花。请问这个转换工作？是否在转换之前收集（）发生？

I'm running Spark on Hadoop's YARN. How does this conversion work? Does a collect() take place before the conversion?

此外，我需要每一个从节点上安装Python和R的转换工作？我苦苦寻找本文档。

Also I need to install Python and R on every slave node for the conversion to work? I'm struggling to find documentation on this.

推荐答案

数据创建本地数据帧之前被收集。例如 toPandas 方法如下所示：

Data has to be collected before local data frame is created. For example toPandas method looks as follows:

def toPandas(self):
    import pandas as pd
    return pd.DataFrame.from_records(self.collect(), columns=self.columns)

您需要的Python，最佳所有的依赖关系，安装在每个节点上。

You need Python, optimally with all the dependencies, installed on each node.

SparkR对应（ as.data.frame ）仅仅是用于的别名收集。

SparkR counterpart (as.data.frame) is simply an alias for collect.

要总结这两种情况下的数据是收集来驱动节点，并转换为本地数据结构（ pandas.DataFrame 和 ::基地data.frame ）。


To summarize in both cases data is collected to the driver node and converted to the local data structure (pandas.DataFrame and base::data.frame in Python and R respectively).

                        这篇关于火花数据帧转换为大 pandas / R数据框要求的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            将 Spark 数据帧转换为 Pandas/R 数据帧的要求;
                        
                    
                    
                        
                            将 Spark 数据帧转换为 Pandas/R 数据帧的要求;
                        
                    
                    
                        
                            将 Pandas 数据帧转换为 PySpark 数据帧;
                        
                    
                    
                        
                            将熊猫数据帧转换为 zeppelin 中的火花数据帧;
                        
                    
                    
                        
                            将 Pandas 数据帧转换为 Spark 数据帧错误;
                        
                    
                    
                        
                            R：将XML数据转换为数据帧;
                        
                    
                    
                        
                            将Pandas数据框转换为Dask数据框;
                        
                    
                    
                        
                            将 Pandas 数据帧转换为 PyTorch 张量?;
                        
                    
                    
                        
                            R将数据帧转换为JSON;
                        
                    
                    
                        
                            如何RDD对象转换为数据帧中的火花;
                        
                    
                    
                        
                            将数据从xml转换为R数据帧;
                        
                    
                    
                        
                            将Pandas数据框转换为Spark数据框错误;
                        
                    
                    
                        
                            将字典转换为pandas数据框;
                        
                    
                    
                        
                            将pandas数据框转换为列表;
                        
                    
                    
                        
                            Beautifulsoup结果转换为Pandas数据框;
                        
                    
                    
                        
                            将pandas数据框转换为json对象-pandas;
                        
                    
                    
                        
                            将带有架构的火花数据帧转换为json字符串的数据帧;
                        
                    
                    
                        
                            将带有架构的火花数据帧转换为json字符串的数据帧;
                        
                    
                    
                        
                            如何将 Pandas 数据帧转换为 XML?;
                        
                    
                    
                        
                            在将Pandas数据帧转换为Spark数据帧时，是否可以将Float转换为Long？;
                        
                    
                    
                        
                            在 R 中将数据帧转换为 TS;
                        
                    
                    
                        
                            R-数据帧-转换为稀疏矩阵;
                        
                    
                    
                        
                            Pandas 数据帧到 Spark 数据帧，处理 NaN 转换为实际空值?;
                        
                    
                    
                        
                            分配给大R数据帧;
                        
                    
                    
                        
                            将数据帧列表转换为R中的单个数据帧;


    
        
            Python最新文章
            
                    
                        
                            类型错误：只有长度为1的阵列可以尝试拟合指数的数据转换到Python标量;
                        
                    
                    
                        
                            bs4.FeatureNotFound：找不到一棵树建设者您所要求的功能：LXML。你需要安装一个解析器库？;
                        
                    
                    
                        
                            系列的真值是不明确的。使用a.empty，a.bool（），a.item（），a.any（）或a.all（）;
                        
                    
                    
                        
                            （unicode错误）'unicodeescape'编解码器无法解码位置2-3中的字节：truncated \UXXXXXXXX escape;
                        
                    
                    
                        
                            将pandas dataframe中的列从int转换为string;
                        
                    
                    
                        
                            Python：由实例对象调用方法：“missing 1 required positional argument：'self'”;
                        
                    
                    
                        
                            Sparksql过滤与多个条件（与where子句中选择）;
                        
                    
                    
                        
                            JSONDe codeError：期待值：1行1列（CHAR 0）;
                        
                    
                    
                        
                            Cmake不能找到Python库;
                        
                    
                    
                        
                            Python  - 将Dataframe中的所有项目转换为字符串;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.