dataframe 第6页 - IT屋-程序员软件开发技术分享社区

将R中数据框的行转换为列

我有一个这样的数据集 movieID title year country genre directorName Rating actorName1 actorName.2 1 hello 1995 USA action john smith 6 tom hanks ..

发布时间：2022-04-18 14:46:03 r dataframe reshape 其他开发

通过按字母顺序仅对行中的一些字段进行排序来重塑R中的数据帧

我在RStudio中有几个大型数据帧，它们的结构如下： Original data structure structure(list(CHROM = c("scaffold1000|size223437", "scaffold1000|size223437", "scaffold1000|size223437", "scaffold1000|size223437"), POS = c ..

发布时间：2022-04-18 14:07:58 r dataframe sorting reshape alphabetical 其他开发

组合两个 pandas 列作为索引，创建新列，并以它们的列名为值

我有一个df： import pandas as pd df = pd.DataFrame({"A": [1, 3, 7, 10], "B": [2, 5, 8, 11], "C": list("WXYZ") }) print(df) >>> A B C >>>0 1 2 W >>>1 3 5 X >>>2 7 8 Y >>>3 10 11 ..

发布时间：2022-04-18 14:05:40 python pandas dataframe reshape Python

Python DataFrame：将一列转换为多列

我有一个如下所示的数据帧： df = pd.DataFrame({'month':['2017-09-27','2017-09-27','2017-09-28','2017-09-29'],'Cost':[100,500,200,300]}) 如何才能获得这样的df： 2017-09-27 2017-09-28 2017-09-29 100 20 ..

发布时间：2022-04-18 13:43:50 python-3.x pandas dataframe reshape Python

在Python中将长数据重塑为宽数据(Pandas)

我正在尝试将我的长数据重塑为宽格式。数据当前如下所示： OBS . date . TICKER . RET 1 . 20050131 . AAPL . 0.02 2 . 20050231 . AAPL . 0.01 3 . 20050131 . GOOG . 0.05 4 . 20050231 . GOOG . 0.03 我希望获得如下数据： TICKER . 20050131 ..

发布时间：2022-04-18 13:41:45 python pandas dataframe reshape Python

数据框列上的字符串拆分

我有一个data.frame，其中一个变量是向量(或列表)，如下所示： MyColumn ..

发布时间：2022-04-18 12:15:31 r dataframe reshape 其他开发

如果当前行和前一行满足某些条件，如何在R数据框中添加新列，以显示当前行和前一行的值之和？

假设您有一个数据框，其中包含用df ..

发布时间：2022-04-17 22:54:40 r dataframe dplyr tidyr 其他开发

更快/更好：循环遍历数据帧的每一行或将其拆分成一个长度为`nrow`，R

我只是在想，这是否是一个应该考虑的严重权衡。假设您在R中有一个数据帧，并且想要对每个观测(行)执行一个操作。我知道迭代行已经是一个微妙的问题，所以我只是想知道三个选项中的哪一个：每行上正常的for循环将数据帧拆分成nrow元素列表，对每个元素进行操作并将结果绑定在一起并行执行上述操作在没有任何基准测试的情况下，这基本上就是我用伪代码要求的： library(fu ..

发布时间：2022-04-17 22:13:37 r dataframe parallel-processing future 其他开发

计算以上行的算术平均数

我有一个数据集，如下所示： Value Type mean -1.975767 Weather -0.540979 Fruits -2.359127 Fruits -2.815604 Corona -0.929755 Weather 我要迭代每一行并计算上面每一行的平均值(仅当Type匹配时)。我想将此值放在平均值 ..

发布时间：2022-04-17 20:47:07 python pandas dataframe numpy mean Python

计算上面行的平方和

我有一个数据集，如下所示： Value Type X_sq -1.975767 Weather -0.540979 Fruits -2.359127 Fruits -2.815604 Corona -0.929755 Weather 我想遍历每一行，并计算上面每一行的平方和(仅当Type匹配时)。我想将此值放在X. ..

发布时间：2022-04-17 20:45:40 python pandas dataframe numpy mean Python

如何用R中的其他数据框更新数据框

我有两个数据帧。第一个是原始数据帧。第二个是更改的数据帧(此数据列可以由用户更改)。我想用df2(更改的数据)更新df1数据框。请参考预期结果例如1、2 我真的很感谢大家的帮助。 # data frame 1 (orignal datas) age ..

发布时间：2022-04-16 16:00:14 r dataframe updates 其他开发

行值在新迭代后被替换

我有一个如下所示的函数，并在for循环中运行它： def findInfo(url, df): allLinks = getAllLinks(url) katalogLinks = getKatalogLinks(allLinks) if len(katalogLinks) == 0: df = df.append({'Company URL' : u ..

发布时间：2022-04-16 15:47:29 python python-3.x pandas dataframe data-analysis Python

Pandas Dataframe的日志文件

我有日志文件，其中有很多行，格式为： LogLevel [13/10/2015 00:30:00.650] [Message Text] 我的目标是将日志文件中的每一行转换为漂亮的数据框。我已经试着这样做了，通过在[字符上拆分行，但是我仍然没有得到一个整齐的数据帧。我的代码： level = [] time = [] text = [] with open( ..

发布时间：2022-04-16 15:31:50 python python-3.x pandas dataframe data-analysis Python

Case_When函数从R到Python

如何在python代码中实现R的Case_When函数？以下是R：的Case_When函数 https://www.rdocumentation.org/packages/dplyr/versions/0.7.8/topics/case_when 作为最小的工作示例，假设我们有以下数据帧(以下是python代码)： import pandas as pd import n ..

发布时间：2022-04-16 15:29:55 python pandas dataframe data-analysis Python

如何在写入文件之前定义行的顺序？

我已接受对我的问题how-to-save-the-edge-list-of-igraph-object-with-the-predefined-layout的回答。我在回答时使用了建议的代码： edges ..

发布时间：2022-04-16 13:51:20 r dataframe matrix layout igraph 其他开发

如何保存具有预定义布局的图形对象的边缘列表？

我已经读取了R igraph - save layout?，但在我的情况下，它被要求将Begin和End的边的位置与边列表一起保存到一个文件中。我有tree图形对象和平面上预定义的mylayout布局。 tree ..

发布时间：2022-04-16 13:25:01 r dataframe igraph 其他开发

如何在Python语言中将加权边表转换为邻接矩阵？

数据位于Excel文件中，第一列表示第一个节点，第二列表示第二个节点，第三列包含权重。节点为字符串。例如：苹果香蕉65 橙色苹果32 推荐答案首先要做的是导入EXCEL文件。最直接的方法是使用pandas： import pandas data = pandas.read_excel("path/to/edgelist", header=None) ..

发布时间：2022-04-15 20:02:11 python dataframe graph-theory Python

尝试为SHEET_NAME=NONE的文档中的每个工作表运行PYTHON PANAS脚本，但不起作用

几天来，我一直在尝试解决sheet_name=None的问题，但我尝试的所有东西都不起作用。我需要读取一个EXCEL文档，并对文档中的每个工作表运行此操作，并保留工作表的名称(我不知道工作表名称)。我试过这样的东西 dfs = pd.read_excel('products2.xlsx', sheet_name=None, index_col=[0]) for name, df in dfs ..

发布时间：2022-04-15 16:45:25 python excel pandas dataframe spreadsheet Python

PANDA：基于多列对数据表的行运行计算，并将输出存储在新列中

我正在尝试计算两个位置之间的距离，我已经得到了这两个目的地的经度和纬度。在我的CSV中，我有4列(LAT1、LON1、LAT2、LON2)，我如何应用下面的代码，以便用下面的代码计算出的距离创建名为‘Distance’的第5列？ import math from math import sin, cos, sqrt, atan2, radians # approximate radius ..

发布时间：2022-04-15 13:21:46 python pandas dataframe distance haversine Python

R：将数据帧用于热图

几天前我已经发布了一个关于热图的问题：R heatmap: assign colors to values 答案已经对我的问题帮助很大(感谢@Pedro Alencar)，所以这个代码可以工作： # Library library(ggplot2) library(plyr) set.seed(10) # Dummy data x ..

发布时间：2022-04-14 19:52:28 r dataframe heatmap 其他开发

dataframe相关内容