从pandas.DataFrame的每一列获取最高值 [英] Get top biggest values from each column of the pandas.DataFrame

查看:90
本文介绍了从pandas.DataFrame的每一列获取最高值的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

这是我的pandas.DataFrame:

import pandas as pd
data = pd.DataFrame({
  'first': [40, 32, 56, 12, 89],
  'second': [13, 45, 76, 19, 45],
  'third': [98, 56, 87, 12, 67]
}, index = ['first', 'second', 'third', 'fourth', 'fifth'])

我想创建一个新的DataFrame,其中将包含我data DataFrame每一列中的前3个值.

I want to create a new DataFrame that will contain top 3 values from each column of my data DataFrame.

这是预期的输出:

   first  second  third
0     89      76     98
1     56      45     87
2     40      45     67

我该怎么做?

推荐答案

创建一个函数以返回系列的前三个值:

Create a function to return the top three values of a series:

def sorted(s, num):
    tmp = s.sort_values(ascending=False)[:num]  # earlier s.order(..)
    tmp.index = range(num)
    return tmp

将其应用于您的数据集:

Apply it to your data set:

In [1]: data.apply(lambda x: sorted(x, 3))
Out[1]:
   first  second  third
0     89      76     98
1     56      45     87
2     40      45     67

这篇关于从pandas.DataFrame的每一列获取最高值的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆