apply相关内容
我在 Pandas 中有一个包含四列的数据框.数据由字符串组成.示例: A B C D0 2 asicdsada v:cVccv u1 4 ascccaiiidncll v:cVccv:ccvc u2 9 sca V:c u3 11 lkss v:cv u4 13 lcoao v:ccv u5 14 wuduakkk V:ccvcv: u 如果 Col D 中的 Col C 包含子字符串 '
..
样本数据 dfData 我有一些 ID,其中有四列用于测量累积距离.我想创建新列,给出每列的实际距离,即从前一列中减去下一列.例如该表应如下所示: ID DistA DistB DistC DistD1 1 10 5 5 402 2 8 27 5 153 3 15 25 10 54 4 22 11 12 35 5 15 5 10 20 更长的方法是 dfData$disA 是否有
..
如何计算高于阈值序列的每列值的数量? 即:计算每一列的值的数量,大于 100,然后大于 150,然后大于......并将结果存储在数据框中? # 可复制的数据#(原始数据是每年按列组织的每日流量值)设置种子(1234)数据 = data.frame(“1915" = runif(365, min = 60, max = 400),《1916》= runif(365, min = 60, m
..
我正在尝试计算每一列中特定值的频率. 基本上,我正在研究不同的细菌分离株(由每一行代表)对不同抗生素(每列代表)的治疗有何反应.“1"表示分离株对抗生素具有抗性,而“0"表示分离株对抗生素敏感. antibiotic1 所以看第一行,分离株 1 对抗生素 1 耐药,对抗生素 2 敏感,对抗生素 3 敏感. 我想计算对每种抗生素耐药的分离株百分比.即,将每列中“1"的数量相加,然后
..
我遇到了“二元运算符的非数字参数"错误.我知道这两个参数都是数字.奇怪的是,如果我只是单独执行那行,计算就可以工作,但是当我尝试将它包装在“应用"中时,它给了我“二元运算符的非数字参数"错误. 这里是错误: IPmz * mz_winppm 错误:二元运算符的非数字参数 它们是数字: >模式(IPmz)[1]“数字">模式(mz_winppm)[1]“数字" 这是我的代码: Fin
..
我在这里问了几个关于 Scheme/SICP 的问题,而且答案经常涉及使用 apply 过程,我在 SICP 和本书的索引中都没有看到它只列出了一次,结果是一个脚注. 一些用法的例子基本上是这个问题的每一个答案:Going从 Curry-0, 1, 2, 到 ...n. 我对 apply 的工作原理很感兴趣,我想知道是否有一些示例可用.怎么可能把apply过程改写成另一个函数,比如像这
..
简单的数据框定义示例: df = pd.DataFrame({'A':[2,4,1],'B':[8,4,1],'C':[6,2,7]})df A B C0 2 8 61 4 4 22 1 1 7 尝试了解以下块中函数参数调用的区别: df.apply(sum)df.apply('sum') 两者似乎都给出了相同的正确结果: A 7乙 1315数据类型:int64 我知道对于这个简单
..
我有一个包含一系列数字列的数据框,两边被(不相关的)字符列包围.我想获得一个保留不相关列位置的新数据框,并通过某个分组向量将数字列彼此添加(或按组将其他一些行函数应用于数据框).示例: sample = data.frame(cha1 = c("A","B"),num1=1:2,num2=3:4,num3=11:12,num4=13:14,cha2=c("C","D"))>样本cha1 num1
..
这是我的数据框,功能: df = pd.DataFrame({'G': 'x x y y'.split(),'C': [1, 2, 1, 2],'D': [2, 2, 1, 1]})定义 CD(df):返回 df['C'] * df['D'] 这是我的数据框的样子: G C D0 × 1 21 × 2 22 年 1 13 年 2 1 当我跑步时 df.groupby('G').appl
..
我有两个数据框,一个 (p) df 包含要转换的列,第二个 (a) 包含 pd.series 形式的转换参数: p=np.random.rand(5,3) #创建数据框cols=["A","B","C"]df1=pd.DataFrame(p,columns=cols)a=np.array([0.3,0.4,0.5]) # 创建一系列变换参数a=pd.Series(a,index=cols) 我
..
我正在尝试复制在 sapply 中应用多个函数的解决方案 R-Bloggers 但我无法让它以所需的方式工作.我正在处理一个简单的数据集,类似于下面生成的数据集: require(数据集)crs_mat
..
我想在 R 中引用数据框中多列的所有行上应用一个函数.例如,如果我有一个名为“data"的数据框,其中包含三个变量“var1"、“var2"和"var3",我想对每一行应用一个函数: myfunc
..
我在熊猫数据框中有这种奇怪的行为.我在具有以下示例内容的列上使用 .apply(single_seats_comma):(1,2).但是,它似乎将其返回为 range(1,3) 而不是字符串 (1,2).其他行也有超过 2 个条目,例如(30,31,32).我有一个函数,它在 , 上拆分并将括号中的每个值转换为一个新行,但是 (x,x) 它会中断. def single_seats_comm
..
这是一个简单的数据帧: 将 numpy 导入为 npdd=pd.DataFrame(np.arange(35).reshape(7,5), columns=list('xyzwv'))dd['w']=list('AABBBCC') ,即: 现在我试试下面的代码 def func(x):打印(x)返回 xdd.groupby('w').apply(func) 然后打印出来: 我认
..
在 R 中,将包含字符数字套件(作为字符向量)的列表转换为数字的最快方法是什么? 使用以下虚拟数据: set.seed(2)N = 1e7ncol = 10myT = formatC(matrix(runif(N), ncol = ncol)) # 转换为字符的矩阵# 每一行都折叠成一组字符:myT = apply(myT, 1, function(x) paste(x, collapse
..
我的问题有点与 我之前的问题有关问题. 假设我有一个矩阵和 4 个向量(可以考虑另一个矩阵,因为向量的顺序很重要),我想按顺序获得与每个向量重合的行号.我希望解决方案避免重复向量并尽可能高效,因为问题规模很大. 示例. set.seed(1)M = 矩阵(rpois(50,5),5,10)v1 = c(3, 2, 7, 7, 4, 4, 7, 4, 5, 6)v2= c(8, 6,
..
我有以下一段代码 scala>val builder = new StringBuilder("foo bar baz")生成器:StringBuilder = foo bar baz标度>(0 到 5) foreach { builder.append("!") }标度>builder.toStringres15: String = foo bar baz ! 我想实际上就像 (0 到 5
..
给定一个 function,它接受多个参数并返回多个值,如下所示: def tuple_unpack(value, another_value):'''做了一些有趣的事情......'''返回值,another_value 有没有办法将这样的函数应用到 pandas dataframe 其中对于 2 个函数参数,我可以从 2 列传递值,然后将输出元组解包到多个列如下: df[['value_
..
我将三个数据框合并到一个列表中 d1 我想提取列表中每个元素的第一行,将它们逐行绑定并另存为 csv 文件. 例如,在上面的例子中,我想从 d1、d2 和 d3 中提取第一行 row1.d1 并将它们绑定在一起 dat
..
我正在尝试在 data.frame 上使用 apply 和用户定义的函数.在函数内部,我想使用列名(用于绘图的标题),但 apply 似乎去除了列名并只传递了一个向量.MWE: trialData 返回NULL.有没有办法访问函数内部的列名? 解决方案 感谢评论者我到达了下面,他们给了我想要的结果. trialData
..