零假设不成立是大于还是小于


零假设不成立是大于还是小于  

昨天我们学习了如何用回归直线描述两个数值型变量之间的关系。今天,我们将深入了解一种判断两个分类变量是否相关的统计方法——独立性检验,然后深入概率的世界,挑战与机遇并存!

知识点一:分类变量与列联表

所谓分类变量,是指那些不是连续数字而是表示类别的变量,比如性别、是否吸烟、对某个提议的态度等。当我们要研究两个分类变量之间是否存在关联时,比如性别和吸烟状况,我们经常会把数据整理成列联表。列联表是一个表格,其中行代表一个变量的值,列代表另一个变量的值,表格中的数字代表同时拥有这两个值的频数。

例如,我们可以创建一个2x2的列联表来研究200名学生的性别和是否喜欢运动的关系。

知识点二:独立性检验的基本思想

看到上面的列联表,我们知道男生中喜欢运动的比例是80%,女生中是60%。这两个比例不同,这是否意味着性别和喜欢运动有关联呢?可能是抽样误差造成的。独立性检验的目的是通过统计方法判断这种差异是真实的关联还是仅仅是巧合。

核心思想包括:

提出假设(零假设H0):先假设两个分类变量是独立的,即没有关联。

计算期望频数:如果H0成立,我们可以根据总人数计算出每个单元格“理论上”的频数。

比较观测值和期望值:比较实际观察到的频数和在独立假设下计算出的期望频数之间的差异。差异越大,原假设(独立)越可能不成立。

构造检验统计量():使用一个叫做卡方(Chi-squared,)的统计量来衡量总体差异的大小。值越大,差异越显著。

做出决策:将计算出的值与临界值进行比较。如果值大于临界值,我们就拒绝原假设H0,认为两个变量不独立;如果值小于或等于临界值,我们不能拒绝原假设H0,认为没有足够证据表明它们有关联。

知识点三:统计量的计算

计算那个衡量“差异大小”的卡方值的具体公式为(对于2x2的列联表):设四个单元格的观测频数分别为a、b、c、d,总样本量为n=a+b+c+d。则统计量为: = [n (ad - bc)] / [(a + b)(c + d)(a + c)(b + d)] 。

以一个例子来说明:假设我们调查了某校200名学生关于性别与是否喜欢运动的情况。计算得到的值约为9.52。

知识点四:随机事件与概率的基本概念

生活中有很多事情的结果是不确定的,比如明天会不会下雨,抛的结果等。这些在一定条件下可能发生也可能不发生的事件叫做随机事件。概率是用来度量一个随机事件发生的可能性的大小的数值。

与概率有关的一些基本概念包括:随机试验、样本空间、随机事件、必然事件、不可能事件以及概率的计算等。

知识点五:事件的关系与运算

事件之间也存在关系,就像集合一样。包括包含关系、相等关系、和事件、积事件、互斥事件和对立事件等。这些关系的运算可以帮助我们更深入地理解随机事件之间的联系。

练习题:

1. 分类变量是什么?构造一个关于学生是否喜欢某种食物和他们的课程爱好的简单2x2列联表。

2. 独立性检验的原假设是什么?如果计算出的值很大,我们应该拒绝还是接受原假设?

3.(选做)使用临界值表判断,当自由度为1时,p=0.05对应的临界值是3.841时,对于我们在知识点三中计算出的值(约9.52),在0.05的显著性水平下,能否认为性别与喜欢运动有关联?

4. 抛掷一枚均匀的两次的样本空间是什么?事件A:“恰好有一次正面朝上”包括哪些样本点?

5. 掷一个骰子时,事件B是“点数大于4”,事件C是“点数是奇数”。B和C是互斥事件吗?是对立事件吗?求B∪C和B∩C的含义及其结果。

至此数学之门已然开启同学们要继续加油努力前行@高中数学学习秘籍@高中数学进阶学习@高中数学实战技巧分享。

  零假设不成立是大于还是小于