LDA生成的组件比Python中要求的少 [英] LDA Producing Fewer Components Than Requested in Python

查看:31
本文介绍了LDA生成的组件比Python中要求的少的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在处理以下数据集:

http://archive.ics.uci.edu/ml/datasets/Bank+Marketing

可以通过单击数据文件夹链接找到数据。存在两个数据集,一个训练集和一个测试集。我使用的文件包含两个集合中的组合数据。

我正在尝试应用线性判别分析(LDA)来获得两个组件,但是,当我的代码运行时,它只产生一个组件。如果设置"n_Components=3",我也只获得单个组件

我刚刚完成了PCA测试,它对我提供的任何数字"n"都很有效,因此"n"小于或等于转换时X数组中存在的特征数。

我不确定为什么LDA的行为看起来如此奇怪。以下是我的代码:

#Load libraries
import pandas
import matplotlib.pyplot as plt
from sklearn import model_selection
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

dataset = pandas.read_csv('bank-full.csv',engine="python", delimiter=';')

#Output Basic Dataset Info
print(dataset.shape)
print(dataset.head(20))
print(dataset.describe())

# Split-out validation dataset
X = dataset.iloc[:,[0,5,9,11,12,13,14]] #we are selecting only the "clean data" w/o preprocessing
Y = dataset.iloc[:,16] 
validation_size = 0.20
seed = 7
X_train, X_validation, Y_train, Y_validation = model_selection.train_test_split(X, Y, test_size=validation_size, random_state=seed)

# Feature Scaling
from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_temp = X_train
X_validation = sc_X.transform(X_validation)

'''# Applying PCA
from sklearn.decomposition import PCA
pca = PCA(n_components = 5)
X_train = pca.fit_transform(X_train)
X_validation = pca.transform(X_validation)
explained_variance = pca.explained_variance_ratio_'''

# Applying LDA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
lda = LDA(n_components = 2)
X_train = lda.fit_transform(X_train, Y_train)
X_validation = lda.transform(X_validation)

lda

lda(至少推荐答案中的实现)最多只能生成k-1个组件(其中k是类数)。因此,如果您处理的是二进制分类,您最终将只得到1维。

有关详细信息,请参阅手册:http://scikit-learn.org/stable/modules/generated/sklearn.discriminant_analysis.LinearDiscriminantAnalysis.html

还相关: Python (scikit learn) lda collapsing to single dimension

LDA ignoring n_components?

这篇关于LDA生成的组件比Python中要求的少的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆