dataframe 第4页 - IT屋-程序员软件开发技术分享社区

如何使用递归记录父子层次结构中的所有路由？

我正在尝试浏览分层数据帧，并将每条可能的路由记录到另一个数据帧中。这些路线的深度可以可变。原始数据帧(DF)。最高列表示父列中的值不是任何：的子值父级子项最高 a b 1 b c 0 b d 0 d e 0 最终目标数据帧：级别3 级别2 级别1 级别0 a b c a b d e 这就是我目前拥有的 def search(parent ..

发布时间：2022-06-20 17:33:08 python pandas dataframe recursion hierarchy Python

在一个数据帧上使用Apply来填充另一个数据帧中缺少的值

首先，我想说我对R是个新手。这个问题令人沮丧，简直令人难以置信。我试过申请、申请和申请。所有这些都有错误。我迷路了。我要做的是，如果记录没有时间(其中为NA)，则从“结果”中提取时间，并将其放入“记录”中的时间中。我已经在传统的for循环中做到了这一点，但它使代码难以阅读。我已经阅读了应用函数可以让这变得更容易。 Data Frame "Results" ID Time(se ..

发布时间：2022-06-20 15:21:18 r dataframe na 其他开发

如何识别数据帧中哪些列不是每行的“NA”？

这是与How to identify which columns are not "NA" per row in a matrix?相同的问题，但针对的是数据帧而不是矩阵。我有一个205行62列的数据帧。我想为值不是NA的每一行标识列名。例如： col1 col2 col3 col4 col5 col6 row1 NA NA NA NA fact ..

发布时间：2022-06-20 15:14:21 r dataframe na 其他开发

用相邻行而不是列中的值替换行中的NA

原始数据： V1 V2 1 c1 a 2 c2 b 3 c 4 d 5 c3 e 6 f 7 c4 g 可重复的样本数据 V1 = c('c1','c2',NA,NA,'c3',NA,'c4') V2 = c('a','b','c','d','e','f','g') data.frame(V1,V2) 预期产 ..

发布时间：2022-06-20 14:38:45 r dataframe na 其他开发

Pandas-从具有嵌套列表列表的现有列创建动态列时出错

我要从包含列表嵌套列表作为值的现有列创建两个列。由3个公司参与者及其角色组成的记录行： **row 1** [{'roles': [{'type': 'director'}, {'type': 'founder'}, {'type': 'owner'}, {'type': 'real_owner'}], 'life': {'name': 'Lichun Du'}}] **row 2 ..

发布时间：2022-06-18 15:51:39 python pandas dataframe pandas-groupby nested-lists Python

R数据帧到嵌套列表

我要将此格式的数据帧(Tbl)转换为以下嵌套列表(Tbllst)： library(tidyr) tbl ..

发布时间：2022-06-18 15:05:32 r list dataframe nested nested-lists 其他开发

ParserError：标记化数据时出错。C错误：第4行应有7个字段，读取CSV文件 pandas 时看到10个错误

我正在尝试使用 pandas 读取csv文件 df1 = pd.read_csv('panda_error.csv', header=None, sep=',') 但我收到此错误： ParserError: Error tokenizing data. C error: Expected 7 fields in line 4, saw 10 为了便于重现，这里是CSV文件pan ..

发布时间：2022-06-16 09:54:40 python pandas dataframe tokenize Python

向Spark数据框中的每个组添加数据行

我有这个数据帧- data = [(0,1,1,201505,3), (1,1,1,201506,5), (2,1,1,201507,7), (3,1,1,201508,2), (4,2,2,201750,3), (5,2,2,201751,0), (6,2,2,201752,1), ..

发布时间：2022-06-11 14:34:14 dataframe pyspark group-by datetime-format week-number 其他开发

R列检查是否包含来自另一列的值

在R中有没有办法检查一列中的值是否包含另一列中的值？在下面的示例中，我试图查看col2中的值是否包含在col1中的值中(独立于每一行)，但收到一条警告消息：“参数‘Pattern’的长度>1，将只使用第一个元素”。标志栏第一行/最后一行应显示“是”，第二行和第三行应显示“否”。如有任何关于如何解决的想法，我们将不胜感激。 col1 ..

发布时间：2022-06-10 22:51:09 r dataframe contains grepl 其他开发

在R中使用Apply或MAP函数时，如何将列名传递给函数？

我正在尝试将多个函数应用于同一个DataFrame，但我无法成功地将列名作为参数传递，该参数使用purrr::imap。但是，我一直收到以下错误： UseMethod(&QOOT；SELECT&QOOT；)中出错：没有适用于‘SELECT’的方法应用于类&Character&Quot；的对象我尝试了在SO上找到的所有组合(例如，使用!!!、[[、enquo、sys.lang等等)。当我 ..

发布时间：2022-06-09 14:27:25 r dataframe purrr 其他开发

将data.Frame列名传递给使用Purrr：：map的函数

我正在处理嵌套的数据帧，希望将顶级数据帧的名称和包含低级数据帧的列的名称传递给使用Purrr：：map迭代低级数据框的函数。这里有一个玩具示例。 library(dplyr) library(purrr) library(tibble) library(tidyr) df1 ..

发布时间：2022-06-09 13:46:55 r dataframe purrr 其他开发

Pandas DataFrame中的列从浮点数输出到货币(负值)

我有以下数据框(由负数和正数组成)： df.head() Out[39]: Prices 0 -445.0 1 -2058.0 2 -954.0 3 -520.0 4 -730.0 我正在尝试更改价格列，以便在将其导出到Excel电子表格时显示为货币。我使用的以下命令运行良好： df['Prices'] = df['Prices'].map("${:,. ..

发布时间：2022-06-06 18:58:32 python pandas dataframe currency Python

如何将1分钟的开盘-高-低-收盘数据转换为另一个时间范围(FX：5分钟，1小时)？

我对Python和StackOverflow还很陌生，如果我在这篇文章中犯了错误，请原谅我。我有一个Pandas DataFrame，它包含1分钟的开盘、高点、低点和收盘数据，以时间为指数，针对一种货币。我将如何将其转换为数据帧，例如，具有5分钟的开盘、高点、低点、收盘数据，并使时间戳也符合？以下是打印出的1分钟数据的示例： ZARJPY_ope ..

发布时间：2022-06-06 18:52:40 python pandas dataframe currency finance Python

循环图像，保存ID名称，并将其相应地存储在数据帧中

您好，简介：我正在尝试设置一个 pandas 数据框来将一些离散的化学值连接到一些图像。这比我目前的水平略高，所以我希望在这里得到一些帮助。我到目前为止得到的：我目前已经从提供的数据表中切出了两列，如下所示。现在，我在这里有1688个数据点，并且有1225个10x10x4(RGBA)大小的图像要与其关联。(1225，10，10，4)Uint8 这些图像在第 ..

发布时间：2022-05-30 21:07:14 python pandas dataframe python-imaging-library glob Python

将文本文件保存到.npy文件

我在带有数字扩展名的目录中有许多文本文件(例如：signal_data1.9995100000000001,signal_data1.99961等) 文件内容如下 Signal_Data1.9995100000000001 -1.710951390504200198e+00 5.720409824754981720e-01 2.730176313110273423e+00 ..

发布时间：2022-05-30 20:11:40 python-3.x dataframe numpy for-loop glob Python

在海运中绘制单独的组时，如何将数据作为一个组包括在内

我有一个数据框，我必须比较具有来自我的数据框(过滤)的特定值的列的中值与具有原始数据框中的所有值的相同列的中值。这是我所达到的最大限度，我已经提供了两个图表，我认为这两个图表应该在同一个图表中：我的目标是将这两个图表合并到一个图表中。以下是我提供该输出的代码。 filt_waterfront = df['waterfront'] == 1 fig, axs = plt.su ..

发布时间：2022-05-28 19:08:06 python pandas dataframe seaborn boxplot Python

重复数据框中的行并添加增量字段

我找到了很多关于如何复制记录的答案，但我还想为每个复制的记录添加一个增量字段。我发现了一个类似的问题，但它们没有startValue字段：Repeat the rows in a data frame based on values in a specific column。我的数据框以开头 df ..

发布时间：2022-05-28 17:40:09 r dataframe repeat 其他开发

如何重复 pandas 数据帧？

这是我的DataFrame，应该重复5次： >>> x = pd.DataFrame({'a':1,'b':2}, index = range(1)) >>> x a b 0 1 2 我希望得到这样的结果： >>> x.append(x).append(x).append(x) a b 0 1 2 0 1 2 0 1 2 0 1 2 但肯定有 ..

发布时间：2022-05-28 16:43:47 python pandas duplicates dataframe repeat Python

在PySpark中更新数据帧的某些行或创建新的数据帧

我是新手，我的目标是在AWS Glue中使用PySpark脚本：从Glue=>；中的输入文件读取数据帧完成更改满足条件=>；面临问题的某些行的列将同一架构上更新的数据帧写入S3=>；Done 任务似乎很简单，但我找不到完成它的方法，并且仍然面临着更改代码的不同问题。到目前为止，我的代码如下所示： Transform2.printSchema() # ..

发布时间：2022-05-28 12:35:27 dataframe pyspark aws-glue 其他开发

如何基于多个条件将1个 pandas 数据帧合并或合并到另一个 pandas 数据帧

我有两个数据帧： df1和df2，df1用作df2的引用或查找文件。这意味着我们需要使用df1的每一行与df2的每一行进行匹配，然后将df1合并到df2中，然后输出新的df2。 df1： RB BeginDate EndDate Valindex0 0 00 19000100 19811231 45 1 00 19820100 1 ..

发布时间：2022-05-26 15:15:08 python pandas dataframe numpy numpy-ndarray Python

dataframe相关内容