python3.6怎么单独正则化/标准化DataFrame中的指定列数据

查看:614
本文介绍了python3.6怎么单独正则化/标准化DataFrame中的指定列数据的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

问题:
读入一个excel表后,想要正则化(标准化)其中的某一列数据,还试过单独正则化后,再把两个DataFrame拼接的,用过insert和cancat,append这些,但是因为索引对不上号,不能直接拼到后面,顺序会改变,出现很多NAN
代码:

zscore = lambda x: (x-x.mean())/x.std()
transformerd = selectPE.groupby('流通市值').transform(zscore)

rr1_normalized = preprocessing.normalize(selectPE['利润同比%%']).T
rr2_normalized = pd.DataFrame(rr1_normalized)
selectPE.insert(5, 'norm利润同比%%', rr2_normalized)

单独正则化得到一列后,不会连接到一起,要是能在DataFrame中直接正则化那一列多好啊,下面是正则化后的利润同比那一列

rr2_normalized

解决方案

不知道你说的单独正则化是什么意思,我猜你是想对某列进行处理

import pandas as pd
data = [
    [1, 2, 3],
    [5, 4, 1],
    [3, 3, 2]
]

df = pd.DataFrame(data, columns=['A', 'B', 'C'])
df['D'] = df.apply(lambda x: x.mean(), axis=1)
print df

这篇关于python3.6怎么单独正则化/标准化DataFrame中的指定列数据的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆