Logistic回归是指机器学习算法,用于预测分类因变量的概率.在逻辑回归中,因变量是二元变量,由编码为1的数据组成(布尔值为真和假).
在本章中,我们将重点关注开发回归模型在Python中使用连续变量.线性回归模型的示例将侧重于从CSV文件中进行数据探索.
分类目标是预测客户是否会订阅(1/0)定期存款.
import pandas as pd import numpy as np from sklearn import preprocessing import matplotlib.pyplot as plt plt.rc("font", size=14) from sklearn.linear_model import LogisticRegression from sklearn.cross_validation import train_test_split import seaborn as sns sns.set(style="white") sns.set(style="whitegrid", color_codes=True) data = pd.read_csv('bank.csv', header=0) data = data.dropna() print(data.shape) print(list(data.columns))
按照以下步骤在Anaconda Navigator中使用"Jupyter Notebook"实现上述代码 :
步骤1 : 使用Anaconda Navigator启动Jupyter笔记本.
第2步&减号;上传csv文件以系统方式获得回归模型的输出.
第3步 : 创建一个新文件并执行上面提到的代码行以获得所需的输出.