809669515

2018-11-01   阅读量: 1643

数据分析师 数据挖掘 机器学习

双变量分析 - 分类和数值

扫码加入数据分析学习群

带误差线的折线图

带有误差线的折线图将信息显示为由直线段连接的一系列数据点。每个数据点是分类变量的相应类别的数值数据的平均值,其中误差条显示标准误差。这是一种总结信息片段如何相互关联以及它们如何相互依赖的方式iris_linechart.xlsx)。 

组合图

组合图表使用两种或更多图表类型来强调图表包含不同类型的信息。在这里,我们使用条形图显示分箱数值变量的分布和折线图,以显示分类变量中所选类别的百分比。组合图是最好的可视化方法,用于演示预测器(X轴)对目标(Y轴)的可预测性。

Z检验和t检验

Z检验和t检验基本相同。他们评估两组的平均值是否在统计上彼此不同。该分析适用于比较两类分类变量的数值变量的平均值。 

如果Z的概率很小,则两个平均值之间的差异更显着。

t检验

n1n2小于30时,我们使用t检验代替Z检验。

示例:在两个不同类别的分类变量(O-Ring Failure)中,数值变量(温度)的均值(平均值)之间是否存在显着差异?

O形圈失效   温度

低概率(0.0156)意味着失败的O形环的平均温度与完整的O形环的平均温度之间的差异是显着的。

方差分析(ANOVA)

ANOVA检验评估两组以上的平均值是否在统计学上彼此不同。该分析适用于比较分类变量的两个以上类别的数值变量的平均值。

示例

在分类变量(Outlook)的三个类别中,数值变量(湿度)的平均值之间是否存在显着差异?

0.0000 0 4 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子