awk以平均匹配文件中的字符串 [英] awk to average matching strings in file

查看:75
本文介绍了awk以平均匹配文件中的字符串的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试使用$3awk中的值的总和来平均匹配的$2行.我在下面的尝试未取得预期的结果.我做错了事,但不知道是什么.谢谢:).

I am trying to average the matching $2 lines using the total of the values in $3 with awk. My attempts below have not yielded the desired results. I am doing something wrong but do not know what. Thank you :).

输入

chr7:83016288-83016376 SEMA3E 70.3
chr7:83606437-83606522 SEMA3A 78.6
chr7:83640327-83640417 SEMA3A 79.2
chr8:61693548-61693999 CHD7 83.4
chr8:61714076-61714162 CHD7 86.5

所需的输出 -3位小数

SEMA3A 76.0
CHD7 84.9

尝试1次

awk '{cnt[$2]++ } {sum += $3 } END { if (NR > 0) print sum / NR }' input
79.6 -- average of all lines in input

尝试2次

awk '{cnt+=$2; num+=$3} END{print "avg="cnt/num}' input
avg=0 -- not sure what this is calculating

推荐答案

$ awk '{sum[$2]+=$3; count[$2]++} 
    END{for(k in sum) printf "%s %.1f\n",  k, sum[k]/count[k]}' file

CHD7 85.0
SEMA3A 78.9
SEMA3E 70.3

这篇关于awk以平均匹配文件中的字符串的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆