正在获取百分比和计数Python [英] getting percentage and count Python

查看：0 发布时间：2022/8/3 11:39:11 python pandas percentage pandas-groupby

本文介绍了正在获取百分比和计数Python的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

Suppoosedf.bun(df是Pandas DataFrame)是一个多索引(日期和名称)，变量是以字符串形式写入的类别值，

date      name             values
20170331  A122630          stock-a
          A123320          stock-a
          A152500          stock-b
          A167860          bond
          A196030          stock-a
          A196220          stock-a
          A204420          stock-a
          A204450          curncy-US
          A204480          raw-material
          A219900          stock-a

如何才能使其表示同一日期内的总计数及其百分比，从而使每个日期的表如下所示，

date           variable    counts     Percentage
20170331          stock         7           70%
                   bond         1           10%
           raw-material         1           10%
                 curncy         1           10%

我已经做了print(df.groupby('bun').count())作为解决此问题的办法，但它缺少..

cf)在获取df.bun之前，我使用以下代码将嵌套词典导入到Pandas DataFrame。

import numpy as np
import pandas as pd

result = pd.DataFrame()
origDict = np.load("Hannah Lee.npy")
for item in range(len(origDict)):
    newdict = {(k1, k2):v2 for k1,v1 in origDict[item].items() for k2,v2 in origDict[item][k1].items()}
    df = pd.DataFrame([newdict[i] for i in sorted(newdict)],
                      index=pd.MultiIndex.from_tuples([i for i in sorted(newdict.keys())]))
    print(df.bun)

推荐答案

我认为需要SeriesGroupBy.value_counts：

g = df.groupby('date')['values']
df = pd.concat([g.value_counts(), 
                g.value_counts(normalize=True).mul(100)],axis=1, keys=('counts','percentage'))
print (df)
                       counts  percentage
date     values                          
20170331 stock-a            6        60.0
         bond               1        10.0
         curncy-US          1        10.0
         raw-material       1        10.0
         stock-b            1        10.0

另一个解决方案，size表示计数，然后除以transform和sum创建的新Series：

df2 = df.reset_index().groupby(['date', 'values']).size().to_frame('count')
df2['percentage'] = df2['count'].div(df2.groupby('date')['count'].transform('sum')).mul(100)
print (df2)
                       count  percentage
date     values                         
20170331 bond              1        10.0
         curncy-US         1        10.0
         raw-material      1        10.0
         stock-a           6        60.0
         stock-b           1        10.0

解决方案之间的差异是第一次按组的值排序，第二次排序MultiIndex。

这篇关于正在获取百分比和计数Python的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

正在获取百分比和计数Python [英] getting percentage and count Python

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录关闭

正在获取百分比和计数Python [英] getting percentage and count Python

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录 关闭

登录关闭