dataframe相关内容

获取 Pandas DataFrame 的名称

如何获取 DataFrame 的名称并将其打印为字符串? 示例: boston(分配给 csv 文件的变量名) 将pandas导入为pdboston = pd.read_csv('boston.csv')print('根据 %s 表,获胜者是 A 队.) % boston 解决方案 您可以使用以下内容命名数据框,然后随意调用该名称: 将pandas导入为pddf = pd.Da ..
发布时间:2021-11-30 15:45:48 Python

如何找到所有附加的数据框?

当我在 R studio 中附加 data.frame 时,我收到以下消息: 以下对象被屏蔽了...... 我忘记分离 data.frame data 有没有办法知道附加了哪些 data.frames? 有没有办法用一个命令或函数分离所有的 data.frames? 解决方案 首先,我建议你停止使用 attach().这确实是一个糟糕的做法,因为几乎总是有更好的替代方 ..
发布时间:2021-11-30 15:07:25 其他开发

分配给 R 中的变量数据框

我正在尝试将一列数据分配给现有数据框中的新列.数据框循环变化,从scores.d 到scores.e.我想要的输出是用 vals 填充 score.X$new.col,其中 X 替换为当前的 dfname. dfnames 这给了我一个错误,因为assign正在寻找一个字符串作为第一个参数,当我需要它包含列名时.简单地将 $new.col 添加到粘贴命令是行不通的(假设 $ 不从字符串转换) ..
发布时间:2021-11-30 12:24:29 其他开发

从函数返回数据帧并将其存储在工作区中

这是我使用 R 的第一周,我似乎无法管理关于函数的一件事. df 这个函数现在只是在屏幕上打印数据集.但我想将结果作为单独的数据框存储在我的工作区中.在这个例子中,这将给出三个数据帧;a、b 和 c. 感谢您的帮助. 解决方案 Roland 有针对特定问题的正确解决方案:不需要多个 split().只是为了确保: split() 返回一个列表.要在您的工作区中获取单独的数据框, ..
发布时间:2021-11-30 12:21:20 其他开发

重新分配唯一值 - pandas DataFrame

我试图将 pandas df 中的 assign unique 值分配给特定的个人. 对于下面的 df,[Area] 和 [Place] 将共同组成 unique 值是各种工作.这些值将分配给个人,总体目标是尽可能少地使用个人. 诀窍是这些值不断地开始和结束,并持续不同的时间长度.任何时候分配给个人的最唯一值是3.[On] 显示当前出现的 [Place] 和 [Area] 的唯一值的数 ..
发布时间:2021-11-30 12:21:00 Python

R:动态创建变量名

我希望使用 for 循环创建多个数据框,然后使用 merge() 将它们拼接在一起. 我可以使用 assign(paste(), blah) 创建我的数据框.但是,在同一个 for 循环中,我需要删除每个数据框的第一列. 这是我的代码的相关部分: for (j in 1:3){#这是创建每个数据框#这有效分配(粘贴(平台,j,“df",sep =“_"),read.csv(file ..
发布时间:2021-11-30 12:19:44 其他开发

使用函数参数作为 R 中新数据框的名称

这个很简单,但是我搜索了这个小问题没有找到解决方案. 我想使用函数的参数作为新数据框的名称,例如: assign.dataset 然后 assign.dataset(new.dataframe.name) 只需创建一个名为 dataname 的新数据集. 我曾尝试使用 paste 和 assign 功能,但没有成功. 非常感谢 解决方案 你可以这样做... as ..
发布时间:2021-11-30 12:17:30 其他开发

在 Pandas df 中重新分配列值

这个问题与排班或人员配备有关.我正在尝试为个人(员工)分配各种工作.使用下面的 df, `[Person]` = 个人(雇员)`[Area]` 和 `[Place]` = 独特的工作`[On]` = 每个时间点有多少独特的工作发生 所以 [Area] 和 [Place] 一起构成了不同作业的 unique 值.这些值将分配给个人,总体目标是尽可能少地使用个人.分配的给任何一个人的最独特的值是3 ..
发布时间:2021-11-30 12:16:36 Python

R 将列类从一个数据框中分配(或复制)到另一个

我生成了一个大型数据框(1700+ obs,159 个变量),其中包含一个从网站收集信息的函数.通常,该函数会查找某些列的数字值,因此它们是数字值.但是,有时它会找到一些文本,并将整列转换为文本.我有一个 df,其列类是正确的,我想将这些类“粘贴"到一个新的、不正确的 df.比如说: dfCorrect ..
发布时间:2021-11-30 12:14:35 其他开发

如何在数据框的特定命名列上使用“assign()"或“get()"?

有没有办法为数据框中的特定列赋值?例如, dat2 = data.frame(c1 = 101:149, VAR1 = 151:200)j = "dat2[,"VAR1"]" ## 或, j = "dat2[,2]"分配(j,1:50) 上述方法不起作用.这也不是: j = "dat2"分配(获取(j)[,“VAR1"],1:50) 解决方案 让我们假设我们有一个 valid data. ..
发布时间:2021-11-30 12:13:28 其他开发

R:分配数据框列的变量标签

我正在努力处理 data.frame 列的可变标签.假设我有以下数据框(更大数据框的一部分): data 我还有一个命名向量,其中包含此数据框的变量标签: var.labels 我想使用label 中的函数将var.labels 中的变量标签分配给数据框data 中的列code>Hmisc 包.我可以像这样一个一个地做,然后检查结果: >标签(数据[[“年龄"]])la ..
发布时间:2021-11-30 12:12:31 其他开发

对火花数据帧的同一列进行多个聚合操作

我有三个包含以下信息的字符串类型数组: groupBy 数组:包含我想要对数据进行分组的列的名称. 聚合数组:包含我要聚合的列的名称. operations 数组:包含我想要执行的聚合操作 我正在尝试使用 spark 数据框来实现这一点.Spark 数据帧提供了一个 agg(),您可以在其中传递 Map [String,String](列名和各自的聚合操作)作为输入,但是我想对数据 ..
发布时间:2021-11-28 21:44:12 其他开发

如何在熊猫上按键转置数据帧组?

我的数据库中有这张表,我需要一个通过survey_id的转置组 id answersurvey_id question_number questionid216 0.0 69 3 2.0217 3.0 69 4 3.0218 0.0 69 5 4.0219 0.0 69 6 5.0221 0.0 69 8 7.0 像这样: 调查P01 P02 P03 P04 P0569 1 1 2 2 1 ..
发布时间:2021-11-27 12:06:42 Python

将 Dataframe 保存到 csv 直接到 s3 Python

我有一个想要上传到新 CSV 文件的 Pandas DataFrame.问题是我不想在将文件传输到 s3 之前将其保存在本地.有没有像 to_csv 这样的方法可以直接将数据帧写入 s3?我正在使用 boto3. 这是我目前所拥有的: 导入boto3s3 = boto3.client('s3', aws_access_key_id='key', aws_secret_access_key='s ..
发布时间:2021-11-27 10:50:32 Python

如何将数据写入 Redshift,这是在 Python 中创建的数据帧的结果?

我在 Python 中有一个数据框.我可以将此数据作为新表写入 Redshift 吗?我已成功创建到 Redshift 的数据库连接,并且能够执行简单的 sql 查询.现在我需要给它写一个数据框. 解决方案 您可以使用 to_sql 将数据推送到 Redshift 数据库.我已经能够通过 SQLAlchemy 引擎使用与我的数据库的连接来做到这一点.只要确保在您的 to_sql 调用中设置 ..
发布时间:2021-11-27 10:34:28 Python

多个数据框的 Python 3D 图

假设我有三个 Python pandas DataFrames: df_sale = pd.DataFrame([[20,30,10], [30,20,20], [20,40,40]], columns=list("ABC"))乙丙0 20 30 101 30 20 202 20 40 40df_people = pd.DataFrame([[2,3,1], [3,2,2], [2,4,4]], ..
发布时间:2021-11-25 04:18:37 C#

如何在 R 中将二维数据框“展平"或“折叠"为一维数据框?

我在 R 中的 data.frame 中有一个带有距离的二维表(从 csv 导入): CP000036 CP001063 CP001368CP000036 0 a bCP001063 a 0 cCP001368 b c 0 我想“压平"它.我在第一个列中有一个轴的值​​,在第二个列中有其他轴的值,然后在第三列中有距离: Genome1 Genome2 DistCP000036 CP0010 ..
发布时间:2021-11-24 22:12:03 C#

如何在数据框中制作矩阵元素的数据集?

我在.TXT中有3个参数'A','B','C'的数据集> 文件,在我将它们打印成 24x20 矩阵后,我需要收集 'A','B','C' 的第一个元素在熊猫 dataframe 中放入长数组,然后是每个的第二个元素,然后是第三个,依此类推,直到第 480 个元素. 所以我的数据在文本文件中是这样的:我的数据是txt文件如下: id_set: 000答:-2.46882615679乙:-2. ..
发布时间:2021-11-18 03:53:24 其他开发