网易首页 > 网易号 > 正文 申请入驻

一篇讲透 GRR 的正确用法

0
分享至

字数统计:5863字 预计阅读时间:约 12 钟


很多质量人都“做过”GRR,却很少真正“看懂”GRR。报告里一堆百分比,看似合格,却不敢拍胸口说:这个测量系统真的可靠吗?到底是量具在“抖”,还是人各有各的量法,还是样件本身选错了?更现实的是——一旦数据被拿去做SPC、能力分析、放行判定,风险就被放大了。

GRR真正的难点,从来不在公式,而在看清测量噪声从哪里来。如果测量系统本身不稳定,后面所有“数据驱动决策”,都是假精确。

这篇内容,不讲空洞标准,也不堆统计名词,而是从现场最关心的问题出发:

如何拆清重复性、再现性和零件差异?

三种GRR方法各在什么场景下用?

流程怎么设计才不“自欺欺人”?

计算结果该怎么看,才能真正指导改善?一次把GRR的方法、流程和逻辑讲明白,让你不再“算完却不敢用”。

01One

GRR在“量”的,其实不是产品,而是你能不能信任这把尺子

很多质量问题并不是“产品出了问题”,而是我们用来判断产品的那套测量方式,本身就不稳定。为什么同一个零件,今天测是合格,明天又不合格?为什么换一个人测,数据就“飘”了?

这些现象背后,并不神秘,测量结果的波动,通常只来自三个地方:

重复性(EV):同一个人,用同一把量具,反复测同一个零件,数据自己会不会乱跳?如果这一块就很大,说明“工具或方法”本身不稳。

再现性(AV):换不同的人来测,同一个零件,结果差得多不多?如果差异明显,问题往往不在产品,而在“人对方法的理解不一致”。

零件差异(PV):不同零件之间,本来就存在的真实差别。这一部分,反而是我们最希望看到的差异

GRR要做的,其实只有一件事:把你看到的所有波动拆开来看——到底是真实的产品差异,还是测量系统制造出来的“噪声”?

其中,测量系统带来的噪声,就是重复性+ 再现性。在实际项目中,行业里通常用下面的判断参考:

%GRR ≤ 10%:测量系统是可信的,可以放心使用

10% < %GRR ≤ 30%:勉强可用,但存在风险,需要结合用途评估并推动改善

%GRR > 30%:测量系统不可接受,数据不宜用于决策,应尽快调整方案需要特别提醒的是:这个百分比,并不是“唯一答案”。有的算法是拿总波动作对比,有的则是拿公差范围作对比,两种口径关注点不同,结论也可能不同。

真正专业的GRR分析,从来不会只给一个数字,而是会说明:这个结论,是基于什么前提得出的02Two

三种GRR方法,各自解决什么问题?别再“选错工具干对活”

我们经常看到一种情况:GRR做了,数字也算出来了,但方法本身就选错了。结果不是“算不准”,而是根本不该这么算。GRR并不是只有一种算法,不同方法,解决的是

方法一:均值–极差法(Xbar-R)——最快的“体检筛查”

这是很多人最早接触的GRR方法。

它的优点很直观:

  • 计算逻辑清楚

  • 不需要太多统计背景

  • 非常适合现场培训和快速判断

简单理解,它做的事情是:看同一个人反复测时,数据“抖不抖”;再看换人以后,平均值“偏不偏”。

但它也有明显局限:对数据结构要求高,一旦现场存在复杂差异,结果容易失真,精度不如更高级的方法。

更适合用在这些场景:

1、量具或检具的初步筛选

2、快速判断一把量具是否“明显不靠谱”

3、人员、零件、重复次数都比较规范、标准的情况(例如:3个人 × 10件 × 每件测2~3次)它更像一次快速体检,告诉你“有没有大问题”。

方法二:方差分析法(ANOVA GRR)——最可靠的“精密诊断”

这是目前最常用、也是最推荐的GRR方法。

它最大的价值在于:不仅能分清是人、是量具,还是零件的问题,还能识别“人和零件之间的交互影响”。

通俗点说:有些人不是“测得不好”,而是对某一类零件特别容易偏,这种问题,只有ANOVA才能看出来。

它的优势在于:

  • 统计模型更完整

  • 面对复杂现场情况更稳健

  • 结果更容易被外部认可

典型适用场景包括:

  • 关键特性、特殊特性的测量

  • 需要提交给客户或第三方的正式GRR报告

  • 怀疑不同人员测量“风格差异”明显的情况

如果说Xbar-R是体检,ANOVA更像一次全面体检+ 专科检查

方法三:属性一致性分析(Kappa)——给“判定型检验”用的

并不是所有检验,都能用数字表示。很多现场工作,其实是在做判断:1、合格/ 不合格2、有缺陷/ 无缺陷3、A / B / C等级

这类数据,本身就不适合用计量型GRR,否则算得再认真,结论也是错的。

属性一致性分析关注的不是“差多少”,而是:

  • 同一个人,前后判定是否一致

  • 不同人之间,判定是否一致

  • 判定结果,是否和标准样件或主判一致

常见应用场景包括:

  • 外观判定

  • 缺陷分类

  • 拉力合格/ 不合格判定

  • 一切无法用连续数值表达的检验

在现场,很多人也会把它叫做“属性GRR”。从专业角度看,它属于MSA中的一致性评估,但在管理实践中,这样理解并没有错

强调的一点是:GRR不是“算哪种更高级”,而是——你面对的测量问题,到底是哪一类?方法选对了,数字才有意义;方法选错了,结论只会更自信地走向错误。

03ThreeGRR 标准流程:不是“算一次”,而是验证测量是否可信

无论采用哪种GRR 分析方法,流程本身比工具更重要。真正有效的 GRR,并不是把数据丢进软件,而是按一条清晰的逻辑,逐步验证:这个测量结果,到底能不能被信任。

Step 1:先选量具,更要先想清楚“目的”

在开始之前,必须先回答一个问题:这次GRR 是用于过程控制产品放行判定,还是能力研究?不同目的,对测量误差的容忍度完全不同。如果目的不清,后面的“合格 / 不合格”结论本身就没有意义。

Step 2:选样品——关键不在数量,而在“代表性”

通常推荐选10 件样品,覆盖过程中的正常波动范围。样品不能太“集中”,否则零件间差异(PV)太小,会人为放大 %GRR;也不能选明显异常或超规格的零件,否则结果会偏离真实过程。

Step 3:选人员与重复次数——模拟真实使用场景

常见设计是:3 名检验员(代表不同班组或经验水平),每人对每件零件测量2~3 次。测量顺序必须随机,最好是盲测(遮挡件号),避免记忆对结果造成干扰。

Step 4:统一测量方法,否则结果没有意义

在做GRR 之前,必须确认:测量点位一致、夹持与定位方式一致、读数规则一致。否则你看到的“人为误差(AV)”,本质上只是方法不统一。

Step 5:记录与计算——软件只是工具,不是答案

可以使用MSA 软件(如 Minitab)进行计算,但前提是你理解背后的逻辑。否则报告很容易变成“看不懂、也不敢质疑”的黑箱。

Step 6:判定结果,更要形成改善闭环

GRR 的价值不在“结果是多少”,而在“问题出在哪里”。-是设备重复性(EV)偏大?-是人员差异(AV)明显?-还是存在显著的交互效应?

不同原因,对应的改善方向完全不同。GRR 不是一次性评估,而是测量系统持续改进的起点。

04Four计算里的关键量:GRR不是算出来的,是“拆出来的”

在正式进入计算之前,先说一句容易被忽略的话:GRR的计算不是为了显得专业,而是为了把“混在一起的波动”拆清楚。

下面以连续型(计量型)GRR为例说明。

一、GRR是怎么被“拆开”的?

从统计角度看,测量结果的波动,并不是一整块,而是由几部分叠加而成:GRR(测量系统变差),来自测量本身

它由两部分组成:

1、oEV:量具和方法在同一人重复测量时产生的波动

2、oAV:不同人员之间带来的差异PV(零件变差),来自产品本身的真实差异

所以在逻辑上,整个关系可以理解为:你看到的“总波动”,一部分是真实产品差异,一部分是测量系统制造的噪声。统计上常用的表达是:总变差= 测量系统变差 + 零件真实变差(在计算中,体现为方差相加、标准差用平方和开方)GRR不是在“评价产品”,而是在问——如果产品没变,测量结果还会不会乱跳?

二、为什么会有两种%GRR?差别不在算法,在“参照物”

在实际报告中,最容易让人困惑的,是:同一套数据,用不同口径算%GRR,结论却不一样。这是因为,%GRR本身是一个“相对值”,关键在于你拿什么来当参照。

口径一:相对总波动(TV)

这种算法关注的是:你现在看到的所有波动里,有多少比例来自测量系统。

如果测量系统占比很高,说明数据里“噪声”很多,无论做趋势分析还是能力分析,都不太可靠。

口径二:相对公差(T)

这种算法关注的是:测量系统自身的波动,在公差范围里占了多大空间。它更偏向于放行判定相关的场景:如果测量误差已经接近甚至吃掉了大半个公差,那么“合格 / 不合格”的判断本身就有风险。

两种算法没有对错,但关注的问题不同。因此,一份专业的GRR报告,必须明确说明:用的是哪一种口径,结论适用于什么用途。

三、Xbar-R 法在“算”的,其实是什么?

Xbar-R 法的核心思想,可以用一句话概括:用“极差”,去反推测量的稳定程度。

它大致做了三件事:

1.看同一个人,对同一零件多次测量时,最大值和最小值差多少

2.把这些差值做平均,得到一个“典型波动水平”

3.再通过统计常数,把这个波动换算成标准差

由此得到的,主要是重复性(EV);而不同人员测量结果“平均值之间的差异”,则用于估计再现性(AV)

你不需要记住公式,只需要记住一件事:

  • EV来自“同一个人反复测,还不稳定”

  • AV来自“换一个人,整体水平就变了”

四、ANOVA 为什么更“聪明”?

ANOVA 的优势,不在于算得更复杂,而在于拆得更细。它把总波动分成几块来看:

  • 零件之间的差异(PV)

  • 人与人之间的差异(AV)

  • 同一个人重复测量的误差(EV)

  • 以及——人和零件之间是否存在“交互影响”

所谓交互,通俗地说就是:有些人不是“测得好或不好”,而是对某些零件特别容易偏,对另一些却没问题。一旦这种交互显著,问题通常不在“多培训几次”,而更可能出在:1、定位方式、测量基准、夹具设计、零件形态对测量的影响等。

2、这正是ANOVA 在复杂现场中更可靠的原因。

3、计算本身,并不是GRR的难点。4、真正重要的是:你是否通过这些计算,找到了噪声真正的来源

如果算完以后,你能清楚回答:

  • 噪声主要来自量具,还是来自人?

  • 是方法问题,还是结构性问题?

  • 接下来该改什么,而不是“再算一次”?

那这次GRR,才算真正发挥了价值。05Five结果怎么读,才能真的找到问题?

在咨询中我们最常看到的一种误区是:报告一到手,第一眼就盯着%GRR,看合不合格。但真正有价值的判断,恰恰不在这个数字本身,而在它背后“是谁在制造波动”。一份GRR报告,建议按下面这个顺序去看。

第一步:先看EV ——工具和方法稳不稳

EV(重复性)大,说明即使是同一个人反复测量,结果也不稳定。这类问题,通常不是“人”的问题,而是工具或测量条件的问题。

常见原因包括:

  • 量具分辨力不够,刻度或读数精度本身偏粗

  • 量具状态不好,比如磨损、回零不稳、夹持不牢

  • 环境干扰明显,如温度波动、振动、清洁度不足

  • 测量方法不稳定,例如定位方式不一致、受力大小变化

改善方向通常很明确:不是再培训人,而是换更合适的量具或夹具,统一定位方式,改善环境条件,提升分辨率和稳定性。

第二步:再看AV ——是不是“每个人量的都不一样”

如果AV(再现性)偏大,说明换一个人,测量结果就系统性地发生变化。这类问题,往往不是“某个人不认真”,而是大家对“怎么量”理解不同

常见原因包括:

  • 测量点位或基准理解不一致

  • 受力方式、读数规则各有各的习惯

  • 人员技能差异大,新老员工标准不一致

  • 测量流程缺乏清晰、可执行的统一规范

对应的改善方向是:把“经验里的量法”,变成“写清楚的标准”。包括统一作业指导、用样件对齐理解、明确测量点位,并通过必要的培训和考核,确保大家真的按同一套方法在测。

第三步:最后看PV ——别把“选样问题”当成量具问题

有时%GRR 看起来偏大,并不是量具或人员出了问题,而是PV(零件间差异)太小

这通常意味着:你选的样件,本身就差不多,几乎没有真实差异,在这种情况下,测量系统的波动比例自然会被放大。

常见情形包括:

  • 样件过于集中,只选了“看起来差不多”的零件

  • 只取了同一批次、同一状态下的产品,过程波动没有体现出来

这类问题的对策,不是换量具,也不是改方法,而是重新选样,让样件真正覆盖过程的正常波动范围。真正成熟的GRR解读,从来不是一句“合格 / 不合格”。

而是能回答清楚三件事:

  • 波动主要来自工具、来自人,还是来自样件选择?

  • 这是能力问题、方法问题,还是设计问题?

  • 下一步的改善,应落在哪个环节,而不是“再算一次GRR”?

如果一份GRR报告,能指向明确的改善方向,它才算真正发挥了价值。06Six属性一致性(Kappa)怎么做?怎么读

如果你的检查结果只是合格/ 不合格(OK / NG),或是 A / B / C 这种等级判断,那就不适合用计量型GRR,而应该看**“判断是否一致”,也就是属性一致。

简单来说,它主要看三件事:

  • 同一个人,前后判断一不一样

  • 不同的人,判断结论一不一样

  • 大家的判断,和“标准答案”一不一样

一致性常用Kappa 值来表示,数值越高,说明判断越稳定、越可靠:

  • 大于0.75:判断一致性好

  • 0.4~0.75:一般,有风险

  • 小于0.4:不可靠

需要特别提醒的是:判断不一致,很多时候不是人不行,而是“什么算问题”没有说清楚。比如标准样板不统一、边界模糊、判定条件太主观。

GRR真正想告诉你的,其实只有一句话:如果测量本身不可靠,后面所有数据分析,都是建在沙子上的。

所以,做GRR别只想着“过不过线”,而要想清楚三件事:

  • 问题主要来自工具,还是来自人的判断?

  • 应该换工具、改方法,还是把标准说清楚?

  • 改完以后,能不能再验证一次,确认真的变好了?

把这三件事做好,测量分析才算真正有用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
香港名流饭局一幕:杨澜没理张艺谋,转头握旁人

香港名流饭局一幕:杨澜没理张艺谋,转头握旁人

阿废冷眼观察所
2026-02-14 20:31:06
绝对是细糠!普通女生无成本长脑子的方法,网友:我将慢慢学习

绝对是细糠!普通女生无成本长脑子的方法,网友:我将慢慢学习

夜深爱杂谈
2026-02-08 21:23:15
澳洲杨兰兰是谁?五层“身份套娃”揭秘:她或许根本就不存在

澳洲杨兰兰是谁?五层“身份套娃”揭秘:她或许根本就不存在

麦大人
2025-08-18 18:02:38
工龄31年4个月,个人账户85298.25元,60岁退休,养老金有多少?

工龄31年4个月,个人账户85298.25元,60岁退休,养老金有多少?

起喜电影
2026-02-15 16:47:27
科莫利:意大利足球失去的远比三分更多,这是彻头彻尾的不公

科莫利:意大利足球失去的远比三分更多,这是彻头彻尾的不公

懂球帝
2026-02-15 07:40:47
女老师与学生偷情:一周开房四次使用道具助兴,大量私密细节披露

女老师与学生偷情:一周开房四次使用道具助兴,大量私密细节披露

博士观察
2026-02-15 12:34:22
美军宣布:发动空袭

美军宣布:发动空袭

中国基金报
2026-02-15 16:10:23
什么是干休所,要达到什么军衔的军官,才能进干休所?

什么是干休所,要达到什么军衔的军官,才能进干休所?

触摸史迹
2025-12-21 19:31:28
81年彭真会见江青,江青大骂一句,彭真一脸淡定:你还有什么要求

81年彭真会见江青,江青大骂一句,彭真一脸淡定:你还有什么要求

舆图看世界
2025-12-09 08:45:05
重磅加盟!你好,麦基!彻底轰动整个CBA

重磅加盟!你好,麦基!彻底轰动整个CBA

篮球实战宝典
2026-02-15 16:07:58
别被马斯克忽悠了!星链撑不起人类通讯,中国通信基建才是底气

别被马斯克忽悠了!星链撑不起人类通讯,中国通信基建才是底气

像梦一场a
2026-02-13 20:20:26
宝马独立子品牌发布全新品牌标识!

宝马独立子品牌发布全新品牌标识!

新浪财经
2026-02-14 21:40:19
王菲将六登春晚,献唱《你我经历的一刻》;此前五次登台首首爆火,去年《世界赠予我的》创收视峰值

王菲将六登春晚,献唱《你我经历的一刻》;此前五次登台首首爆火,去年《世界赠予我的》创收视峰值

扬子晚报
2026-02-15 08:40:17
没有新闻发布会,没有告别仪式,几页黑底白字,传奇就这么落幕了

没有新闻发布会,没有告别仪式,几页黑底白字,传奇就这么落幕了

阿浪的篮球故事
2026-02-14 16:30:43
非常观察|马年新表扎堆上市,谁更懂中国市场?

非常观察|马年新表扎堆上市,谁更懂中国市场?

澎湃新闻
2026-02-14 16:22:29
王毅在慕尼黑安全会议上,拿德国和日本作对比,日本媒体人不干了

王毅在慕尼黑安全会议上,拿德国和日本作对比,日本媒体人不干了

安安说
2026-02-15 12:43:39
从被骂水货到大腿!利物浦 21 岁新援爆发,一战打脸所有质疑者

从被骂水货到大腿!利物浦 21 岁新援爆发,一战打脸所有质疑者

奶盖熊本熊
2026-02-15 16:55:57
布伦森和唐斯:为比赛训练了10秒钟 感谢休斯顿带领我们夺冠

布伦森和唐斯:为比赛训练了10秒钟 感谢休斯顿带领我们夺冠

北青网-北京青年报
2026-02-15 15:04:05
全线大涨!超9万人爆仓!

全线大涨!超9万人爆仓!

吉刻新闻
2026-02-15 15:05:37
高志凯:中国若真给日本断供,别说大蒜、洋葱,棺材板可能都没了

高志凯:中国若真给日本断供,别说大蒜、洋葱,棺材板可能都没了

荷兰豆爱健康
2026-02-15 16:47:57
2026-02-15 18:00:49
原广工业
原广工业
就留下你的关注吧
180文章数 27282关注度
往期回顾 全部

头条要闻

网红带货"100%纯牛肉"涉虚假宣传 事后道歉但拒绝赔偿

头条要闻

网红带货"100%纯牛肉"涉虚假宣传 事后道歉但拒绝赔偿

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

科技要闻

发春节红包的大厂都被约谈了

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

艺术
游戏
数码
房产
公开课

艺术要闻

宋徽宗耗费30年,寻得“二王”100幅真迹!

感谢中国玩家支持 《剑星》官方用中文向玩家拜年

数码要闻

央视主持人马凡舒点赞!追觅T60 Ultra洗地机春晚后台实力救场

房产要闻

三亚新机场,又传出新消息!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版