data-manipulation相关内容
我的数据如下所示.我想选择大于/等于35且小于/等于350的值.我也想将这些值替换为 withinrange 值1个353637350355355535555 解决方案 要选择值,请执行以下操作: value [value> = 35&值 = 35&值
..
我有一个数据帧,看起来像下面的示例 df ,它由字符变量 VAR 组成. df
..
我正在使用R编程语言.我使用的计算机没有USB端口或互联网连接-我的R仅带有一些预加载的库(例如ggplot2,reshape2,dplyr和base R). 是否有可能使“平行坐标"成为可能.仅使用"ggplot2"图来绘制(例如以下)图.库而不是“笨拙地"? #load库(我没有GGally)图书馆(GGally)#加载数据(我有MASS)数据(螃蟹,包裹="MASS")#制作2个不
..
有点难以解释,但是我有一个数据框,其值看起来像一个阶梯-对于每个日期,都有不同的列,其中某些日期具有NA.我想创建一个新列,其中包含最后一个非NA列的值. 希望这个例子更有意义: 示例数据框: test
..
我有一个有用信息的数据框: X = c(1,2,3,4,5,6,7,8,9,10)Y = c(5,4,3,2,1,0,1,2,3,4)Z = c(11,12,13,14,15,16,17,18,19,20)df
..
我的数据如下: userID
..
数据帧具有包含遵循命名模式的数千个矢量.每个向量名称都包含一个名词,然后是 _a , _b 或 _c .以下是前10个var和obs: id turtle_a香蕉_a城堡_a turtle_b香蕉_b城堡_b turtle_c香蕉_c castle_cA -0.58 -0.88 -0.56 -0.53 -0.32 -0.42 -0.52 -0.89 -0.72B不适用不适用-0.84 -0.3
..
我正在使用R编程语言.我正在尝试安排"plot1,plot2,plot3,plot4"到在同一页面上: library(kohonen)#fitting SOM库(ggplot2)#图库(GGally)#图使用预定义的调色板的library(RColorBrewer)#colorsiris_complete
..
我正在使用R编程语言.我使用了"rpart"库并使用一些数据拟合决策树: 来自上一个问题的 #:https://stackoverflow.com/questions/65678552/r-changing-plot-sizes库(rpart)car.test.frame $ Reliability = as.factor(car.test.frame $ Reliability)z.auto
..
我正在尝试汇总两个数据帧( df1 和 df2 ). 第一个包含3个变量: ID , Date1 和 Date2 . df1 ID Date1 Date21 2016-03-01 2016-04-011 2016-04-01 2016-05-012 2016-03-14 2016-04-152 2016-04-15 2016-05-173 2016-05-01 2016-06-10
..
我目前正在尝试从CSV文件中特定列下的行中删除特定值. 什么是最好的方法? 是在代码中使用XSLT映射文件还是仅通过代码执行此操作?(使用c#) 我想做的是这样: 操作之前: ID,名称,电子邮件,电话号码,Dob1,John Doe,JohnDoe @ mail.com,123456789,1988-08-082,简恩(Jane Doe),简恩(JaneDoe)@ m
..
我正在学习有关"kohonen"的信息,R中的软件包,用于制作自组织映射(SOM,也称为Kohonen Networks-一种机器学习算法).我在这里关注该R语言教程: https://www.rpubs.com/loveb/som 我试图创建自己的数据(这次同时使用"factor"和"numeric"变量)并运行SOM算法(这次使用"supersom()"函数): #load库并调整颜
..
我正在此处关注本教程: https://www.rpubs.com/loveb/som.本教程说明如何在虹膜数据上使用Kohonen网络(也称为SOM,一种机器学习算法). 我从教程中运行了这段代码: library(kohonen)#fitting SOM库(ggplot2)#图库(GGally)#图使用预定义的调色板的library(RColorBrewer)#colorsiris_
..
此问题是以下内容的继续: Google Apps脚本:如果某些单元格为空白,则表格表单数据操作和删除行 我有一张表格“表单响应”中,用户最多可以填写同一问题5次。以下代码将在“粘贴值”工作表中逐行组织这些行。除此之外,我还尝试按时间戳列按升序对列进行排序(这样,来自Google表单的新回复将显示在顶部)。 第一个问题是我的粘贴值表中有其他列(A,O,P,Q,R,S),这些列不在表单中
..
我希望通过找到一个组内两个不同变量之间的共现来有效地计算一个共现矩阵,理想情况下无需使用迭代所有可能组合的复杂循环。 鉴于我的数据框如下所示: df = data .frame(group = c(1,1,1,2,2,2),var1 = c(1,2,4,2,2,4),var2 = c(4,1,2,1,3 ,2)) > df 组var1 var2 1 1 1 4 2 1
..
我想将数据制成表格,以便因子变量成为列,并保留单元格中另一个变量的值。 所以我尝试了 a = rep(1:3 ,3) d
..
我有以下形式的数据集: 将熊猫作为pd d1 = {'Subject ':[[Subject1','Subject1','Subject1','Subject2','Subject2','Subject2','Subject3','Subject3','Subject3','Subject4','Subject4','Subject4' ], '事件':['1','2','3','1',
..
我有一个国家年份的面板数据集。我想计算事件发生后的时间,以及每个国家/地区的活动总数,随着时间的流逝我会逐渐减少。我在 doBy 包中使用了 timeSinceEvent 函数,该函数返回一个具有所需值的数据框, structure(list(ccode.a = c(2L,2L, 2L,2L,2L,2L,2L,2L,2L, 2L,2L,2L,2L,2L,2L,2L,2L,2L,2L,2L
..
我试图从路径读取少量个文件作为我以前的问题 Jianxun 绝对有道理,但我遇到一个关键错误。对熊猫来说非常新,无法修复错误。 注意:我使用Python 2.7和Pandas 0.16 File_1。 csv IDs,12:00:00 2341,9865 7352,8969 File_2.csv Ids,12:45 :00 1234,9865 84
..
更新:下面的代码似乎有效 我不确定这个问题的答案,因此,我很抱歉不好我尝试寻找“使用Apply组合列表中的不同元素”,但这似乎不起作用。 无论如何,由于抓取网站的结果,我有两个向量提供识别信息,并且有一个包含许多不同表的列表。简化版本如下所示: 受访者
..