网易首页 > 网易号 > 正文 申请入驻

R语言学习笔记(九)-假设检验1

0
分享至

导语:上一期跟大家介绍了R语言学习笔记(八) -极大似然估计,本期跟大家一起学习假设检验的基本原理和计算方法。

01假设检验的定义

还是以抛硬币的例子来说明,假如我们想知道一枚硬币是否均匀,抛硬币100次后统计正反面向上的次数,得到59次正面和41次反面,明显偏离1:1,那么我们是否应该判断该硬币不均匀呢?

现在我们用R语言来实现这一推理过程,假设硬币是均匀的,那么正反面向上的概率各0.5,画出正面向上次数的概率分布:

> numFlips = 100> numHeads = 59> k = 0:numFlips> numHeads = sum(coinFlips == "H")> binomDensity = tibble(k = k, p = dbinom(k, size = numFlips, prob = 0.5))> library("ggplot2")> ggplot(binomDensity) ++geom_bar(aes(x = k, y = p), stat = "identity") ++ geom_vline(xintercept = numHeads, col = "blue"

从图中看到概率最大的k是50,也就是最有可能出现50次正面向上,这很容易理解。现在问题来了,我们的样本数据是59,出现50周围的数字的概率也比较大,我们到底应该判断硬币是否均匀呢?

抛100次硬币出现正面向上的次数k的范围是0-100,这里我们按概率将其分成两个区间,接受域和拒绝域。若出现的样本落在拒绝域中,则拒绝原假设,即认为硬币不均匀。我们还是用代码说明:

> library("dplyr")> alpha = 0.05> binomDensity = arrange(binomDensity, p) %>%+mutate(reject = (cumsum(p) <= alpha))> ggplot(binomDensity) ++geom_bar(aes(x = k, y = p, col = reject), stat = "identity") ++scale_colour_manual(+ values = c(`TRUE` = "red", `FALSE` = "darkgrey")) ++geom_vline(xintercept = numHeads, col = "blue") ++theme(legend.position = "none")

解释一下上述代码。首先我们设定了拒绝域的比例α = 0.05(即显著性水平),然后用dplyr包中的arrange函数对p值从小到大排序。根据累积概率是否大于α将数据分为接受域和拒绝域。下图中红色部分即为拒绝域,我们的样本落在接受域,因此我们应该接受原假设,认为硬币就是均匀的。

事实上R有专门的函数完成上述过程,只需要一个简单的命令:

> binom.test(x = numHeads, n = numFlips, p = 0.5)Exact binomial testdata: numHeads and numFlipsnumber of successes = 59, number of trials = 100, p-value = 0.08863alternative hypothesis: true probability of success is not equal to 0.595 percent confidence interval:0.4871442 0.6873800sample estimates:probability of success0.59

上述过程其实就是一个假设检验,p-value = 0.08863 > 0.05,因此应该接受原假设,即伯努利试验的成功概率等于0.5。

p-value的概念其实是比较难理解的,用通俗的话来说,就是在原假设(H0)正确时,出现现状或更极端的情况的概率。比如上面的例子中,p-value反映的是样本出现正面向上≥59或≤41的概率。我们需要记住的是,p-value小于显著性水平α时,就拒绝原假设。

02假设检验的一般过程

(1)根据实际问题的要求,提出原假设H0和备择假设H1;

(2)给定显著性水平α和样本容量n;

(3)确定检验统计量以及拒绝域的形式;

(4)按P{当H0为真拒绝H0} ≤ α求出拒绝域;

(5)根据样本观察值做出决策,接受或拒接H0。

我们再回顾一下假设检验的两类错误:

实际情况

H0正确

H0错误

结论

接受H0

第Ⅱ类错误

拒绝H0

第Ⅰ类错误

我们无法同时减少这两类错误,因为二者其实是此消彼长的关系,如下图所示,两个峰分别表示统计量在原假设和备择假设下的分布。假设决策边界是黑线,如果统计量位于黑线右侧,则拒绝原假设。假阳性(犯第Ⅰ类错误)的概率就是暗红色区域,假阴性(犯第Ⅱ类错误)的概率是深蓝色区域。当黑线右移时,假阳性减小但假阴性增大;黑线左移时则相反。因此更多的时候我们需要在两类错误中做一个权衡。

03t 检验

我们在实验中最常见的是需要对两组数据进行比较,比如测试某种药物对人体是否有效,某种肥料是否能使植物增产等等。这种两组数据的比较通常都需要进行t检验,下面还是用一个例子说明。PlantGrowth描述了植物在对照(ctrl)和两种处理(trt1和trt2)条件下的干重,我们先画出图像。

> library("ggbeeswarm")> data("PlantGrowth")> ggplot(PlantGrowth, aes(y = weight, x = group, col = group)) ++geom_beeswarm() + theme(legend.position = "none")

现在我们想比较两种处理对植物干重的影响,做t检验如下:

> tt = with(PlantGrowth,+t.test(weight[group =="ctrl"],+weight[group =="trt2"],+var.equal = TRUE)) > ttTwo Sample t-testdata:weight[group == "ctrl"] and weight[group == "trt2"]t = -2.134, df = 18, p-value = 0.04685alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:-0.980338117 -0.007661883sample estimates:mean of x mean of y5.032 5.526

结果给最重要的信息有两个,一个是p-value = 0.04685 < 0.05,另外一个是95%置信区间 = (-0.980 ~ -0.008)不包含0。二者给出的结论是一致的,拒绝原假设,即认为两种处理对植物干重的影响是不一样的。

04置换检验(permutation test)

上述t检验的过程基于两个假设,首先是两个样本都来自正态总体,其次是样本方差相等,这其实是一种理想化的假设。我们可以用置换检验的方法对上述过程进行验证,方法是对样本数据进行重复抽样,做大量的t检验,得出一个统计量的分布。类似于蒙特卡洛方法,置换检验通常也需要很大的计算量。我们用R语言进行上述数据的置换检验

> abs_t_null = with(+ dplyr::filter(PlantGrowth, group %in% c("ctrl", "trt2")), #用filter函数筛选+replicate(10000,+abs(t.test(weight ~ sample(group))$statistic)))#用sample函数对样本标签随机置换> ggplot(tibble(`|t|` = abs_t_null), aes(x = `|t|`)) ++geom_histogram(binwidth = 0.1, boundary = 0) ++geom_vline(xintercept = abs(tt$statistic), col = "red")

我们可以计算出样本统计量处在上述分布的哪个区间,也就是上图中红色线条右侧的面积占比。

> mean(abs(tt$statistic) <= abs_t_null)[1] 0.0489

这个数值跟我们上面t检验的p-value(0.04685)非常近似,因此可以认为上面的t测验的结果是合理的。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人民的选择:高墙建于荒谬,倒于荒谬

人民的选择:高墙建于荒谬,倒于荒谬

小刀99
2024-06-16 07:28:49
桑尼来中国了!博主:新加坡门将桑尼已经来到上海

桑尼来中国了!博主:新加坡门将桑尼已经来到上海

直播吧
2024-06-16 12:59:04
银行女职员表白领导,后续来了:多方介入,网传不实,没利益关联

银行女职员表白领导,后续来了:多方介入,网传不实,没利益关联

眼光很亮
2024-06-16 09:00:09
变天了?英国《经济学人》头条:中国已成为科学的超级大国

变天了?英国《经济学人》头条:中国已成为科学的超级大国

互联网大聪明
2024-06-16 03:04:28
从23万降到13万,打响“价格战”,长近5米媲美奥迪A6,如今销量为0

从23万降到13万,打响“价格战”,长近5米媲美奥迪A6,如今销量为0

隔壁说车老王
2024-06-16 14:08:18
6月16日俄乌最新:铁锅炖大鹅

6月16日俄乌最新:铁锅炖大鹅

西楼饮月
2024-06-16 16:13:50
破案了!欧洲杯场边中文广告,只有国内观众看到?山羊君给出真相

破案了!欧洲杯场边中文广告,只有国内观众看到?山羊君给出真相

体育大学僧
2024-06-15 19:05:21
高中生模仿宋徽宗瘦金体,被老师打0分,评语:不要挑战考试底线

高中生模仿宋徽宗瘦金体,被老师打0分,评语:不要挑战考试底线

熙熙说教
2024-06-16 12:08:10
马来西亚总理不但看破,还非要说破:我不担心台海,原因很简单

马来西亚总理不但看破,还非要说破:我不担心台海,原因很简单

千里持剑
2024-06-16 12:42:12
暴雷!比恒大还多1.14万亿,这家巨头正式进入破产清算

暴雷!比恒大还多1.14万亿,这家巨头正式进入破产清算

财经三分钟pro
2024-06-16 15:12:08
女性私处的“芳草”,竟然是越“浓密”越“渴望”?

女性私处的“芳草”,竟然是越“浓密”越“渴望”?

水白头
2024-06-16 00:06:07
ASML掀老底:3nm芯片实际为23nm,1nm芯片是18nm?

ASML掀老底:3nm芯片实际为23nm,1nm芯片是18nm?

互联网.乱侃秀
2024-06-16 14:14:18
刚向美国否认完“强迫劳动”,宁德时代就被曝要求员工896,奋斗100天

刚向美国否认完“强迫劳动”,宁德时代就被曝要求员工896,奋斗100天

小萝卜丝
2024-06-16 08:32:04
“中国技术不如日本?”中国高铁一公里1万度电,日本只要43度?

“中国技术不如日本?”中国高铁一公里1万度电,日本只要43度?

番茄说史聊
2024-06-15 22:01:17
没有经过任何修复的一张毛主席照片,原汁原味的穿着就是这样

没有经过任何修复的一张毛主席照片,原汁原味的穿着就是这样

大江
2024-06-16 13:00:53
突发!6月14日,“大嫂”高叶被曝出大瓜!

突发!6月14日,“大嫂”高叶被曝出大瓜!

小咪侃娱圈
2024-06-16 11:50:21
“大门紧锁,几乎搬空了”,此前刚换了老板!有人被“忽悠”充了10万元还没消费,多名网红曾宣传

“大门紧锁,几乎搬空了”,此前刚换了老板!有人被“忽悠”充了10万元还没消费,多名网红曾宣传

鲁中晨报
2024-06-16 17:47:10
印度首富之子大婚在即,婚前派对只有一个字:壕!

印度首富之子大婚在即,婚前派对只有一个字:壕!

新民周刊
2024-06-16 15:44:36
瑞士峰会传来消息,好家伙,幸亏中国没去参加,普京早就布好局了

瑞士峰会传来消息,好家伙,幸亏中国没去参加,普京早就布好局了

千里持剑
2024-06-15 12:53:07
医科大教师因抢救患儿上课迟到受处分?校方称正核实,学生称OA系统曾发处分通报

医科大教师因抢救患儿上课迟到受处分?校方称正核实,学生称OA系统曾发处分通报

上游新闻
2024-06-16 13:32:18
2024-06-16 18:30:44
投必得专业论文编译
投必得专业论文编译
学术论文润色编辑及翻译
1323文章数 611关注度
往期回顾 全部

教育要闻

剑南春2024高考专题报道

头条要闻

今年上半年尚未结束 已有4名正部级被查

头条要闻

今年上半年尚未结束 已有4名正部级被查

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

科技要闻

iPhone 16会杀死大模型APP吗?

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

旅游
家居
健康
教育
时尚

旅游要闻

@毕业生,江苏这些景区可享免票或优惠

家居要闻

空谷来音 朴素留白的侘寂之美

晚餐不吃or吃七分饱,哪种更减肥?

教育要闻

填写“高考志愿”,要注意以下这些点

40岁女人的“优雅范”穿搭,夏天学会这么搭,也能美得很轻松

无障碍浏览 进入关怀版