Seaborn - 统计估计

在大多数情况下,我们处理数据整体分布的估计.但是当涉及到集中趋势估计时,我们需要一种特定的方式来总结分布.平均值和中位数是常用的估计分布集中趋势的技术.

在我们在上一节中学到的所有图中,我们对整个分布进行了可视化.现在,让我们讨论一下我们可以用来估计分布的集中趋势的图.

Bar Plot

barplot( )显示分类变量和连续变量之间的关系.数据以矩形条形式表示,条形的长度表示该类别中数据的比例.

条形图表示集中趋势的估计值.让我们使用'titanic'数据集来学习条形图.

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

输出

barplot

在上面的例子中,我们可以看到每个班级中男性和女性的平均幸存数.从情节我们可以理解,存活的男性比男性更多.在男性和女性中,更多的幸存者来自头等.

barplot中的一个特例是显示每个类别中的观察结果,而不是计算第二个变量的统计数据.为此,我们使用 countplot().

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()

输出

条形图

情节说,第三类乘客的数量高于一等和二等.

Point Plots

点图与条形图相同,但风格不同.而不是完整的条形,估计值由另一个轴上某个高度的点表示.

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

输出

zSymbol