data-manipulation相关内容

R:多类矩阵

我正在使用R编程语言.我正在尝试学习如何制作一个“混淆矩阵".用于多类变量(例如如何构造混淆多类变量的矩阵). 假设我生成了一些数据并拟合了决策树模型: #load库库(rpart)图书馆(插入符号)#生成数据一个 ..
发布时间:2021-04-29 18:41:24 其他开发

R-在由不同数据帧中的值定义的一组列中获取最高/最低值

我有两个数据框:一个(A)包含事件的开始日期和结束日期(朱利安日期,所以是连续的天数),另一个(B)包含事件从开始日期到结束日期的值在第一个数据帧中.A中的开始日期是稳定的,结束日期有所不同. 我希望能够为每一行确定起始和结束之间变化(最高和/或最低值)的最大幅值的值日期在B系列中,然后写入新的数据框. 示例数据帧 dfA ..
发布时间:2021-04-29 18:41:21 其他开发

插值缺失值时要牢记循环趋势

想象一下日出的图片,其中一个红色的圆圈被黄色的厚环包围,然后被蓝色的背景包围.将红色设为3,然后将黄色设为2,将蓝色设为1. 1111111111111111211111111122211111122232221122223332222112223222211111222111111111211111 这是所需的输出.但是,记录/文件/数据缺少值(所有元素中有30%丢失). 我们如何 ..
发布时间:2021-04-29 18:41:15 其他开发

如何使用R从列的每个单元格中删除重复的逗号分隔字符值

我有一个包含2列ID和产品的数据框,如下所示: ID产品服装,服饰食品,家具,家具B食品,食品,食品,服装C食品,衣物,衣物 每个ID仅需要唯一的产品,例如: ID产品服装,食品,家具B食物,衣物C食品,服装 我该如何使用R 解决方案 如果数据集中有多个定界符,则一种方法是使用所有定界符拆分"Product"列,并获得 unique ,然后将其粘贴在一起( toString ..
发布时间:2021-04-29 18:41:13 其他开发

熊猫高级分组依据和按日期过滤

通过输入创建输出数据帧,如何在每个ID首次目标== 1时如何过滤行,或者按顺序删除目标为1的每个ID的连续出现,但是在目标之前将全0保持在目标之前= 1. 输入 ID日期目标a1 2019-11-01 0a1 2019年12月1日0a1 2020-01-01 1a1 2020-02-01 1a1 2020-03-01 0a2 2019-11-01 0a2 2019年12月1日1a2 20 ..
发布时间:2021-04-29 18:41:10 Python

R:FUN(X [[i]],...)中的错误:仅在具有所有数字变量的数据帧上定义

我正在使用R编程语言.我正在尝试绘制一些正在使用的分类数据和连续数据,但出现一个错误,告诉我只有使用“仅数字变量"才能进行此类绘制. 图书馆(生存)库(ggplot2)数据(肺)数据=肺data $ sex = as.factor(数据$ sex)data $ status = as.factor(数据$ status)data $ ph.ecog = as.factor(data $ ph.e ..
发布时间:2021-04-29 18:41:02 其他开发

有没有一种方法可以基于列中的因数来遍历数据并累加行数?

我有一些数据,可以对同一事件进行多次观察.基于时间阈值,我想浓缩一下观察结果.但是我想知道我正在凝结多少个(即,有多少个观察成为一个观察).我不确定如何以这种方式遍历数据框. 我尝试编写for循环,if语句,while语句,并在google和堆栈溢出上进行了不懈的搜索.似乎与我需要做的事情无关. 这是我的数据的子集: structure(list(date.time = struc ..
发布时间:2021-04-29 18:40:55 其他开发

将(x,y)坐标映射到R中集合的最近点

我正在构建一个有光泽的应用程序,并且我有一行代码目前正在使我慢下来.我有以下具有1008个唯一(x,y)坐标的数据框(为大拷贝粘贴而道歉,尽管我认为共享整个数据框是有帮助的): dput(rounded_coords)结构(list(xspots = c(1、2.5、4、5.5、7、8.5、10、11.5、13,14.5、16、17.5、19、20.5、22、23.5、25、26.5、28、2 ..
发布时间:2021-04-29 18:40:49 其他开发

Python-Pandas:给定行中最小值的数字/索引

我有一个熊猫数据框,其中包含一行和多列. 我想获取给定行中最小值的列号/索引. 我找到的代码是:df.columns.get_loc('colname') 以上代码要求输入列名.我的数据框没有列名.我想获取最小值的列位置. 解决方案 使用 值 ,仅需要数字数据: df = pd.DataFrame({'B':[4,5,4,5,5,4],'C':[7,8,9,4,2,3 ..
发布时间:2021-04-29 18:40:43 Python

如何使用.query()通过时间戳函数过滤Pandas数据帧

我正在尝试按日期(今天和昨天)过滤Pandas df.为了自动化,我希望使用时间戳功能进行过滤.在R中这是非常无缝的: df%>%过滤器(日期> =今天()-1) 但是,到目前为止,我在熊猫中复制的尝试并未取得任何成功:昨天结果很好,但是.query()无法识别它? yesterday =(date.today()-timedelta(days = 6)).strftime('%Y-% ..
发布时间:2021-04-29 18:40:40 Python

添加零值条目,以便所有组都具有相同项目的条目

我正在尝试使用 Rcharts 创建跨越多个记录区域的堆叠条形图(堆叠单独的组值彼此重叠).数据格式与下面类似. 区域|集团|价值----------------------美国|A |5美国|B |3美国|C |1个英国|A |4英国|B |6法国|C |3 使用下面的代码会生成分组的条形图,效果很好.但是,堆叠式按钮无法更改图表. nPlot(值〜区域,组='组',数据= examp ..
发布时间:2021-04-29 18:40:33 其他开发

dplyr:如何以编程方式在列表列表中包含full_join数据帧?

上下文和数据结构 我将与您分享我庞大的数据集的简化版本.这个简化的版本完全尊重我原始数据集的结构,但是包含的列表元素,数据框,变量和观测值比原始数据集要少. 根据对问题的最高评价:如何制作一个很好的R可重现示例?,我使用 dput(query1)的输出共享我的数据集,通过复制/粘贴以下代码块,您可以立即在R中使用某些内容.R控制台: structure(list(plu = str ..
发布时间:2021-04-29 18:40:30 其他开发

R错误:"check.data中的错误:参数应为数字"

我正在学习有关"kohonen"的信息,R编程语言的库.我创建了一些人工数据来尝试一些功能.我尝试使用"supersom()"仅对连续(即type = as.numeric)数据起作用,并且一切正常.但是,当我尝试运行"supersom()"时,在连续和绝对(类型= as.factor)函数上,我开始遇到一些错误(“参数数据应为数字"). "supersom()"函数具有称为"dist.fc ..
发布时间:2021-04-29 18:40:27 AI人工智能