网易首页 > 网易号 > 正文 申请入驻

机器学习中的问题解决方案:解析解vs数值解

0
分享至

你有没有如下这些疑问:

  • 什么数据最适合我的问题?
  • 什么算法最适合我的数据?
  • 如何实现算法的最优配置?

这篇文章会让你了解为什么没人能告诉你要使用什么算法,或如何为特定的数据集配置算法。另外,找到好的数据、算法、配置实际上是应用机器学习的难点,也是你需要集中解决的部分。

下面让我们开始吧。

解析解vs数值解(Analytical vs Numerical Solutions)

数学运算中,许多问题可以靠解析解和数值解来解决。解析解包括用一种易于理解的形式来描述问题,并计算出精确解。数值解意味着在解法中进行猜测,并测试问题,直到得到足够好的解法。比如平方根就可以用这两种方法的任意一种解决。

我们一般更喜欢解析解,因为它速度更快,而且解法精确。然而,由于时间或硬件容量的限制,有时我们必须采用数值解。举一个很好的例子,在寻找一个线性回归方程的系数时可以进行解析解计算(例如使用线性代数),但如果为了执行解析计算,就无法对应单一电脑内存中的所有数据,这时就可以用数值解(例如使用梯度下降法)。有时,解析解是未知的,我们所能用的就是数值解。

解析解

许多问题都有定义明确的解决方案,一旦问题被定义,解决方案就很明显了。我们可以遵循一套逻辑步骤来计算精确的结果。例如,给定一个特定的算法任务,例如加法或减法,你知道应该用什么运算方法。在线性代数中,将矩阵进行因式分解有一系列方法,具体取决于矩阵的性质,是正方形还是矩形,是否包含实数或虚数等等。

我们可以将这个问题扩展到软件工程上,其中有一些问题会反复出现,不管你的应用特性如何,都可以用已知的有效模式来解决。例如,在游客模式中,对列表中的每一个项目执行操作。

应用机器学习中存在的一些问题定义明确,并附有解析解。例如,无论整数值的数量多少,将分类变量转化为热码编码的方法不仅简单,而且几乎都是用相同的方法。不过在机器学习中,我们关心的大多数问题都没有解析解。

数值解

有很多我们感兴趣的问题都没有精确解。或者说至少我们还没有找到解析解。我们必须对解法进行猜测,并测试这种解法有多合适。这涉及到设计问题,并在候选的解法中进行试误。从本质上说,找到数值解的过程相当于进行搜索。

这种解法有一些有趣的特性:

  • 我们很容易从不合适的解法中分辨出好的解法;
  • 我们经常不客观地觉得自己知道好的解法是什么,并且只能在测试过的候选解法之间比较它们的优点;
  • 我们通常对近似解法或自认为足够好的解法感到满意,而不是真正得到了唯一那个最佳解法。

最后一点是关键,因为我们试图用数值解来解决的问题通常是具有挑战性的(我们没有简单的方法来解决它们),而任何自认为不错的解法都不实用。对于给定的问题有许多解法,甚至其中许多解决方案很合适,可以使用。但在应用机器学习中,我们感兴趣的大多数问题都需要数值解法。还有比这更糟的情况:在此过程中,每个子问题的数值解可能会影响到后续子问题的解法空间。

机器学习中的数值解

应用机器学习是一门与数值有关的学科。给定的机器学习模型的本质是优化,它实际上是在寻找一组带有未知值的项来填充一个等式。每个算法都有不同的方程式和术语,它们可以自由使用这个术语。为了对给定的术语进行预测,这个方程式式很容易计算,但是利用给定的数据,我们并不知道用哪些术语能够得到“好的”甚至“最好的”预测。

这是我们一直想要解决的数值优化问题。它是数值的,因为我们试图用观察到的极限样本来解决优化问题,而这些样本冗杂、不完整并且容易出错。该模型尝试解释数据,并在观察结果的输入和输出之间创建映射。

机器学习中广泛的经验主义解法

机器学习算法的核心——数值优化问题,是嵌套在更广泛的问题内的。具体的优化问题受许多因素的影响,所有因素都为最终解决方案的精华部分做出了巨大贡献,而且这里面不包含解析解。

例如:

  • 用什么数据;
  • 用多少数据;
  • 在建模前如何处理数据;
  • 用什么建模算法;
  • 如何配置算法;
  • 如何评估机器学习算法

客观来说,以上这些是你会在预测模型时遇到的机器学习的问题。没有解析解,所以你只能探索哪种元素组合起来最适用于你的特定问题。这其实相当于重要的搜索问题,这些组合都要被测试和评估。在这样的问题中,你需要知道相对于你已经尝试过的其他候选方案,好的得分应是多少。而且除了试误,或是借鉴其他已得到合适解法的相关问题之外,没有其他的路可走。

这种应用机器学习的经验主义方法通常被称为“搜索式机器学习(machine learning as search)”,并在A Gentle Introduction to Applied Machine Learning as a Search Problem和Why Applied Machine Learning Is Hard两篇论文中有进一步阐述。

回答你的问题

让我们回到你的疑问上来,就是那些关于用什么数据、算法或配置会完美解决你的特定预测建模问题。没人会看你的数据或你描述的问题,然后告诉你怎样解决最好,甚至连差不多的方法都不会提供。

专家们可能会根据经验来进行研究,其中一些前期猜想可能会得到验证,但通常来说都会被否定,毕竟它们太过复杂或干脆就是错误的。

为了找到足够合适的解法,预测建模问题是非常有必要的,这也是作为机器学习从业者应该做的。这样的工作对于应用机器学习来说很困难,但必须一直练习并达到擅长的程度,才能在这一领域中胜任。

总结

在这篇文中,你也许已经明白了解析解和数值解的区别,以及应用机器学习的经验主义属性。

另外你应该也理解了:

  • 解析解是产生精确解的逻辑步骤;
  • 数值解是一种较慢的试误过程,可以得到近似解;
  • 数值解是应用机器学习的核心,用调整过的思维模式来为特定的预测建模问题选择数据、算法和配置。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
啥也不是!中美军机黄海对峙直到最后一刻,韩国也没等来通知

啥也不是!中美军机黄海对峙直到最后一刻,韩国也没等来通知

泄气得爱
2026-02-22 17:50:45
杨紫告别白菊长文,杨紫真的已经瘦到天赋上限了,这也太牛了…

杨紫告别白菊长文,杨紫真的已经瘦到天赋上限了,这也太牛了…

乡野小珥
2026-02-21 19:38:37
春节即将结束,但令人恶心的事情,在全国各地发生了,太真实了

春节即将结束,但令人恶心的事情,在全国各地发生了,太真实了

闻识
2026-02-21 19:30:46
苏翊鸣内向到几乎不用手机,却唯独和佟丽娅保持了十二年联系

苏翊鸣内向到几乎不用手机,却唯独和佟丽娅保持了十二年联系

东方不败然多多
2026-02-22 12:50:53
米兰冬奥名场面!徐梦桃王心迪姐弟恋封神,19年冰雪情成冠军夫妻

米兰冬奥名场面!徐梦桃王心迪姐弟恋封神,19年冰雪情成冠军夫妻

一盅情怀
2026-02-22 17:58:28
三里屯偶遇刘亦菲!随手一拍就是画报,这才是顶流颜值天花板

三里屯偶遇刘亦菲!随手一拍就是画报,这才是顶流颜值天花板

可乐谈情感
2026-02-21 17:50:56
特朗普至今不敢打伊朗,是害怕中国渔翁得利?事实证明,恰恰相反

特朗普至今不敢打伊朗,是害怕中国渔翁得利?事实证明,恰恰相反

青橘罐头
2026-02-21 07:17:45
大S留了一手!台北4.6亿豪宅只归两个孩子所有,具俊晔仅能居住!

大S留了一手!台北4.6亿豪宅只归两个孩子所有,具俊晔仅能居住!

小娱乐悠悠
2026-02-22 14:14:46
不顾家人反对,执意要嫁撒贝宁的富二代李白,如今才知道她有多赚

不顾家人反对,执意要嫁撒贝宁的富二代李白,如今才知道她有多赚

素衣读史
2025-12-30 15:45:13
没人发拜年微信了,这是一个危险的信号

没人发拜年微信了,这是一个危险的信号

茉莉聊聊天
2026-02-18 10:48:40
杨幂父母苏州买千万豪宅!妈妈背爱马仕仪态被吐槽,看来驼背是遗传

杨幂父母苏州买千万豪宅!妈妈背爱马仕仪态被吐槽,看来驼背是遗传

扒星人
2026-02-20 15:17:12
春晚炸出600亿隐形富豪!中国最牛逼的70后夫妻,身家超过刘强东

春晚炸出600亿隐形富豪!中国最牛逼的70后夫妻,身家超过刘强东

小娱乐悠悠
2026-02-22 17:19:32
北京一教师被罚6728万!

北京一教师被罚6728万!

感觉会火
2026-02-22 12:07:21
当年举报毕福剑的那位告密者竟然变成这样了!谁能想到啊?

当年举报毕福剑的那位告密者竟然变成这样了!谁能想到啊?

霹雳炮
2026-02-06 13:48:54
见到交警强行开车门坐自己旁边,陈赓忽然开口:我的车你也敢坐?

见到交警强行开车门坐自己旁边,陈赓忽然开口:我的车你也敢坐?

芊芊子吟
2026-02-22 16:45:08
这日剧含丝量极高!

这日剧含丝量极高!

贵圈真乱
2026-02-21 12:09:35
原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

另子维爱读史
2026-01-16 18:29:22
人民币在朝鲜的购买力,到底有多强?一位中国游客的震撼之旅

人民币在朝鲜的购买力,到底有多强?一位中国游客的震撼之旅

番外行
2026-02-11 14:19:41
央视龙洋:挤走董卿、靠爹上位、央视“穷鬼”,私生活谣言多离谱

央视龙洋:挤走董卿、靠爹上位、央视“穷鬼”,私生活谣言多离谱

大嘴爱哔哔
2026-02-17 07:18:14
厉害!袁弘、张歆艺在武汉买房了!

厉害!袁弘、张歆艺在武汉买房了!

东方不败然多多
2026-02-21 14:49:46
2026-02-22 18:51:00
AiTechYun
AiTechYun
专注于人工智能
101文章数 79关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

7名中国游客遗体从贝加尔湖被打捞出 俄罗斯外长致哀

头条要闻

7名中国游客遗体从贝加尔湖被打捞出 俄罗斯外长致哀

体育要闻

75673人见证!迈阿密0-3:梅西孙兴慜过招

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

游戏
本地
手机
旅游
军事航空

部分地区已提前收到《宝可梦:火红·叶绿》兑换码

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

手机要闻

三星Galaxy AI将升级为多代理生态系统 深度整合Perplexity AI

旅游要闻

春节,盐城珠溪古镇奇幻花灯带你入画

军事要闻

约旦基地美军战机骤增 包括F-35隐形战斗机

无障碍浏览 进入关怀版