建立回归模型

Logistic回归是指机器学习算法,用于预测分类因变量的概率.在逻辑回归中,因变量是二元变量,由编码为1的数据组成(布尔值为真和假).

在本章中,我们将重点关注开发回归模型在Python中使用连续变量.线性回归模型的示例将侧重于从CSV文件中进行数据探索.

分类目标是预测客户是否会订阅(1/0)定期存款.

import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt

plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split

import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))

按照以下步骤在Anaconda Navigator中使用"Jupyter Notebook"实现上述代码 :

步骤1 : 使用Anaconda Navigator启动Jupyter笔记本.

Jupyter Notebook First


Jupyter Notebook Second

第2步&减号;上传csv文件以系统方式获得回归模型的输出.

Jupyter Notebook Third

第3步 : 创建一个新文件并执行上面提到的代码行以获得所需的输出.

Jupyter Notebook Fourth


Jupyter Notebook Fifth