网易首页 > 网易号 > 正文 申请入驻

广义加性模型(GAMs)

0
分享至

作为回归家族的一个扩展,广义加性模型(GAMs)是最强大的模型之一,可以为任何回归问题建模!!

线性模型简单、直观、便于理解,但是,在现实生活中,变量的作用通常不是线性的,线性假设很可能不能满足实际需求,甚至直接违背实际情况。1985 年 Stone 提出加性模型 (additive models) ,模型中每一个加性项使用单个光滑函数来估计,在每一加性项中可以解释因变量如何随自变量变化而变化,解决了模型中自变量数目较多时 ,模型的估计方差会加大的问题。1990 年,Hastie 和 Tibshirani 扩展了加性模型的应用范围 ,提出了广义加性模型(generalized additive models)。

你一定用过线性回归或者多项式回归但说实话,所以让我们先从线性回归方程开始:

y = ax₁+ bx₂ + cx₃+ …+ zxₙ+ C

广义加性模型(GAMs)是这个样子的:

g(y) = w₁F₁(x₁) + w₂F₂(x₂) + w₃F₃(x₃) …wₙFₙ(xₙ) + C

可以看到,除了我们的自变量X被函数嵌套以外,我们的因变量Y也就是预测也不是“ y”本身而是一个函数g(y)。 而w₁,w₂…wₙ是每个自变量函数的权重

Fₙ是什么?它是一组每个特征变量分别建模为目标变量的函数,称为平滑函数(smoothing functions),将所有这些函数加起来预测g(y)。

这个Fₙ的数学表示是什么呢?Fₙ对于不同的特征变量可以采用不同的表示。对于一个特征变量,它可以是多项式方程,对于另一个特征变量,它可以是径向基函数(RBF)。

最常见的平滑函数是回归样条函数(Regression Splines),除此以外其他的基函数也可以使用例如RBF,Tensor,(来自https://fda.readthedocs.io/en/latest/modules/autosummary/skfda.representation.basis.Tensor.html)等。

这里又出现了一个新名词 “基函数”(Basis functions):基函数是一组可以用来表示复杂非线性函数的简单函数。例如假设我们有fₓ= 5 + 2x²,为了表示这个复杂的非线性函数,我们可以使用下面的基函数集:f₁(x)= 1, f₂(x)=x, f₃(x)= x²,因此就得到了fₓ= 5f₁(x) + 0f₂(x) + 2*f₃(x)

基函数有很多种,最常见的可能就是RBF(SVM中的核函数)

样条函数(Splines):样条是基函数的一种,它是由多项式分段定义的函数。分段多项式基本上就是对变量的不同区间有不同表示的多项式。看看下面这个例子:

m*x+a → x<5

m*x+ n*x² → 5

p*x³ → x>10

根据X的不同区间改变多项式的表示,这样的多项式称为分段多项式。根据样条的程度,我们可以有以下可能的基函数,来构造原始的复杂函数

0阶:基函数= f(x) = 1

1阶:基函数= f(x)=1, f(x)=x

2阶:基函数= f(x)=1, f(x)=x, f(x)=x²

有了上面的基础,我们开始说明样条回归。它是一组基础函数集的加权和,其中使用的基函数是样条函数。

Fₙ(xₙ) = Σₖ wₖbₖ(xₙ)

其中

Fₙ=第n个特征的第n个平滑函数(还记得上面GAMs的方程吗?)

bₖ=样条回归的第k个基函数(因为样条回归由多个基函数组成)

σₖ= 从k=0→用于表示特征变量和目标变量之间关系的总基函数的总和。

所以GAMs方程是(如果只使用样条回归)

g(y) = Σₖ wₖbₖ(x₁) + Σₘ wₘbₘ(x₂) + Σₙ wₙbₙ(xₙ) … + C

这里的k, m, n 是不同特征的不同样条函数的阶。公式已经推导出来了,还剩最后一个问题在GAMs方程中g()是什么?为什么我们预测的是g(y)而不是“y”本身?

该解释需要从广义线性模型(GLM)的定义中寻找。 一旦特征变量和目标变量之间的关系不是线性的,我们用于线性回归的线性方程就需要一些修改将目标映射到特征变量,这里的映射有可能会是非线性关系,所以就需要将目标限制在某个特定范围内,也就是将y变为g(y)。

这里的g(y)被称为联系函数(link function ):它的作用就是保持目标变量与特征变量之间的线性关系。正如模型的名字,“广义”这个词描述了GAMs可以满足不同的回归场景,这些场景不需要遵循线性回归的基本假设,所以这个g()可以是任何函数!!

既然是广义的,那么如果要将一个线性回归方程建模为GAM,我们只需要将:

1、联系函数设置成恒等函数
2、Fₙ设置成恒等函数。

g(y) = w₁F₁(x₁) + w₂F₂(x₂) + w₃F₃(x₃) …wₙFₙ(xₙ) + C

也就是说g(x)=x 并且Fₙ(x) =x,那么公式就变成了

y = w₁x₁ + w₂x₂ + w₃x₃ …wₙxₙ

这不就是我们的线性回归方程么

如果你想更详细的研究GAM,那么这里推荐一个库pygam,他是Python中的GAM的实现,它的文档非常详细,如果有兴趣的话建议仔细阅读:https://pygam.readthedocs.io/en/latest/notebooks/tour_of_pygam.html

https://avoid.overfit.cn/post/ef3f8a5743d84b4d879b74cd92bb12d5

作者:Mehul Gupta

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
50万镑奖金如何花?吴宜泽将在英国买一套房,墨菲呼吁向中国学习

50万镑奖金如何花?吴宜泽将在英国买一套房,墨菲呼吁向中国学习

侃球熊弟
2026-05-06 01:24:34
尴尬!家长因孩子膝盖磕破责怪老师被回怼,“是五一假期磕破的”

尴尬!家长因孩子膝盖磕破责怪老师被回怼,“是五一假期磕破的”

火山詩话
2026-05-06 06:39:14
关键时刻,伊朗外长亲自访华,背后释放重磅信号,美担心情况发生

关键时刻,伊朗外长亲自访华,背后释放重磅信号,美担心情况发生

军武咖
2026-05-05 22:05:10
刚刚,全体默哀!已致26死61伤!自5月4日19时起,长沙市所有烟花爆竹生产企业,全面停产整顿

刚刚,全体默哀!已致26死61伤!自5月4日19时起,长沙市所有烟花爆竹生产企业,全面停产整顿

浙江之声
2026-05-05 15:50:01
大快人心!白洋淀五一彻底凉凉,靠宰客敛财的景区终于迎来了报应

大快人心!白洋淀五一彻底凉凉,靠宰客敛财的景区终于迎来了报应

社会日日鲜
2026-05-05 20:11:56
重庆法院神判决:酒店自费130万装空调后,物管费仍需按老标准交

重庆法院神判决:酒店自费130万装空调后,物管费仍需按老标准交

兵叔评说
2026-05-06 11:03:46
秦昊真坦诚啊:和伊能静结婚时,她卡里有6000万,我就20万

秦昊真坦诚啊:和伊能静结婚时,她卡里有6000万,我就20万

观察鉴娱
2026-05-06 09:44:59
广州第一烂尾楼 两千家庭半生遗憾!

广州第一烂尾楼 两千家庭半生遗憾!

说故事的阿袭
2026-05-05 20:20:30
上海嘉定最新公告:区部分街镇行政区划变更

上海嘉定最新公告:区部分街镇行政区划变更

上观新闻
2026-05-06 10:34:05
现场画面:日本首相高市早苗下跪!

现场画面:日本首相高市早苗下跪!

每日经济新闻
2026-05-06 14:13:05
16岁女子玩悬崖秋千坠亡:生前17秒视频曝光,旁人哄笑,错失救援

16岁女子玩悬崖秋千坠亡:生前17秒视频曝光,旁人哄笑,错失救援

李晚书
2026-05-06 10:46:28
丢了7年的手机突然发回定位 还自动拍下了使用者的照片 失主:已经成功要回了手机

丢了7年的手机突然发回定位 还自动拍下了使用者的照片 失主:已经成功要回了手机

闪电新闻
2026-05-06 12:58:59
一粒减肥神药掀翻7个行业!百事麦当劳股价大跌,保险养老竟也被迫重大调整

一粒减肥神药掀翻7个行业!百事麦当劳股价大跌,保险养老竟也被迫重大调整

爆角追踪
2026-05-05 20:01:26
许家印骄奢淫逸细节大曝光

许家印骄奢淫逸细节大曝光

资本董事局
2026-05-06 09:34:03
5月6日,人社部和财政部关于2026年养老金调整通知正式公布了吗?

5月6日,人社部和财政部关于2026年养老金调整通知正式公布了吗?

小彬说事
2026-05-06 09:49:09
挖出戴手铐的女遗骨,鉴定后确定,她就是中央苦苦寻找的人!

挖出戴手铐的女遗骨,鉴定后确定,她就是中央苦苦寻找的人!

小莜读史
2026-05-04 00:01:32
吴宜泽透露拿到奖金后准备在英国买房,50万英镑奖金需交税超23万镑,实际到手约26.5万镑

吴宜泽透露拿到奖金后准备在英国买房,50万英镑奖金需交税超23万镑,实际到手约26.5万镑

大风新闻
2026-05-06 11:53:02
谷爱凌穿“会吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5万颗玻璃泡泡,制作耗时2550小时

谷爱凌穿“会吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5万颗玻璃泡泡,制作耗时2550小时

鲁中晨报
2026-05-05 16:26:17
车企卷赢了参数,为什么还是打动不了用户?

车企卷赢了参数,为什么还是打动不了用户?

刀姐doris
2026-04-29 12:13:42
0-1不敌东南亚劲旅,中国男足遭遇亚洲杯开门黑,晋级形势严峻

0-1不敌东南亚劲旅,中国男足遭遇亚洲杯开门黑,晋级形势严峻

侧身凌空斩
2026-05-06 02:26:35
2026-05-06 15:15:00
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1986文章数 1461关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

男子购百万保险被邀免费游老挝 花数十万买"熊胆"心虚

头条要闻

男子购百万保险被邀免费游老挝 花数十万买"熊胆"心虚

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

神仙友谊!杨紫连续10年为张一山庆生

财经要闻

人形机器人七小龙:谁真能卖 谁在讲故事?

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

数码
本地
教育
游戏
公开课

数码要闻

七彩虹战斧B860M超级黑刃主板图赏:899元的“千元旗舰”

本地新闻

用青花瓷的方式,打开西溪湿地

教育要闻

六条逻辑主线替代四个大概念,反映了怎样的理念? | 高中课标修订解读⑥

掌控阴阳挑战圣山!《生肖山Zodiac Mountain》登陆Steam牌组构建游戏节

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版