python3.6怎么单独正则化/标准化DataFrame中的指定列数据
本文介绍了python3.6怎么单独正则化/标准化DataFrame中的指定列数据的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
问题:
读入一个excel表后,想要正则化(标准化)其中的某一列数据,还试过单独正则化后,再把两个DataFrame拼接的,用过insert和cancat,append这些,但是因为索引对不上号,不能直接拼到后面,顺序会改变,出现很多NAN
代码:
zscore = lambda x: (x-x.mean())/x.std()
transformerd = selectPE.groupby('流通市值').transform(zscore)
rr1_normalized = preprocessing.normalize(selectPE['利润同比%%']).T
rr2_normalized = pd.DataFrame(rr1_normalized)
selectPE.insert(5, 'norm利润同比%%', rr2_normalized)
单独正则化得到一列后,不会连接到一起,要是能在DataFrame中直接正则化那一列多好啊,下面是正则化后的利润同比那一列
rr2_normalized
解决方案
不知道你说的单独正则化是什么意思,我猜你是想对某列进行处理
import pandas as pd
data = [
[1, 2, 3],
[5, 4, 1],
[3, 3, 2]
]
df = pd.DataFrame(data, columns=['A', 'B', 'C'])
df['D'] = df.apply(lambda x: x.mean(), axis=1)
print df
这篇关于python3.6怎么单独正则化/标准化DataFrame中的指定列数据的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文