网易首页 > 网易号 > 正文 申请入驻

二战美赛完美逆袭斩获M奖,他做到了!!!

0
分享至

今天给数乐君大家分享的是两次美赛M奖得主参赛的点滴回顾,希望能给即将参加美赛的同学一些启发,整理不易,点赞转发走一波儿。

赛前准备

从开始接触建模已经比较晚了,错过了2019年的国赛,10月组建小队直冲20美赛,我根据网上的资料将建模类问题分为评价类,数统类,优化规划类和预测类进行学习。

评价类问题的建模算法分为:层次分析法,Topsis优劣解距法、熵权法、灰色关联分析,还有使用最多的综合评价的分级模型(这个详细可以参考经典的葡萄酒问题的论文)。

数统类主要有:典型相关分析、多元线性回归、分类模型、聚类、岭回归和lasso回归、相关系数、因子分析模型、主成分分析等。

预测类有:插值、拟合、灰色预测、时间序列分析、BP神经网络等。

优化类大致为:图论最短路径、线性规划、动态规划、模拟退火、排队论等。

还有在美赛中尽量不要使用灰色开头的模型,据说是因为这个在美国不太认可,最好使用是美国人提出的模型或算法。

对我本人来说,我深入学了评价类和数统、预测类,已经基本可以参加所有的建模比赛了,只要不选有关优化的题就可以。还有一些可能涉及到数据挖掘或机器学习的知识和一些很新的算法,特别是美赛或国赛中可能会遇到,这时只要在知网上多搜集相关论文,然后再学习就来得及,不需要事先都学完。

因为我是队里的建模手,同时也是队长和小半个编程手,所以对我来说熟悉所有的基本算法模型非常重要。当遇到问题时,能着手分析出来应该使用什么模型,到时候再在自己总结的文档里面找到相应模型的具体使用方法就可以。

对建模手来说,最重要的是分析能力,因为比赛中(特别是美赛)的题目都比较抽象(像做阅读理解一样),很难直接看出使用什么模型。因此分析和抽丝剥茧的找出题目中实际想表达的意思就很重要。如果你分析不出来可能整个队就无法向下进行。同时最好论文手也可以学习一下所有的模型大概都是什么,不然到时候可能就是建模手去写中文论文了。

同时多看几篇论文,主要看整体结构和摘要。也可以准备一些信或者备忘录的模板。同时队伍在正式比赛前最好进行一次模拟,找去年的题目来分析和完整做一下。

还有要有一定的审美,自从看了2019年的养龙就发现美赛很看重写作和美观易读。一定要简洁美观!只要能用图表形象化数据的一定要用!

基本情况

我是我们队的队长,还有一位同计算机系的男生负责主编程,和一位女生负责写论文。最好建模手和论文手的英语程度要比较好,因为不管是题目中译英还是写时候的英译中,机翻都不太准,特别是题目有时候还是需要看原英文版的问题。通常建模手也要和论文手一起写论文,所以对英语还是有一定的要求的。

我们这次写的还是很快的,只熬了倒数第二天的晚上,熬到了4、5点左右,最后一天下午6点就结束了。这次因为疫情只能线上,还是比较不适应的,一定要全天保持语音,不然不知道什么时候队友就消失了。

选题

我们选的是C题。数据比较大,但是用的也基本就是上面说的那几类我深入学的模型的拓展。ICM的题这次我们也看了一下,就是题目很复杂,F题这次涉及到什么海岛移民,反正就是涉及到很多政策或者文化、环境等的问题,如果对国外这些比较了解的大佬可以尝试一下,反正我们几个是看着题目就晕了。

C题就是比较传统的回归、预测、相关分析和逐对比较法等的模型应用。但是也有创新的需要用到NLP(自然语言处理)来对文本评论进行分析。

问题大概是:通过对微波炉,婴儿奶嘴和吹风机三种商品的数据文件中客户提供的评分和评论进行数据分析,帮助阳光公司在线上市场推出新产品时取得成功。

建模过程

首先第一步要做的就是查询已有的论文来启发自己的思路,我们针对题目,提取了关键词“在线评论”来在知网上进行查找有关论文。同时由于对亚马逊不是很了解,所以我们也从google上搜索了亚马逊来了解这个购物网站的一些评星规则,以及他们特有的vine计划和“verified_purchase”的具体含义,以及如何提高自己的销量等。

Q1:分析提供的三个产品数据集,用那些将帮助Sunshine公司在他们的三个新的在线市场产品获得成功的因素(数学意义上的证据、有意义的定量和/或定性模式、关系、策略、星级评级,评论,和有用评分的关系参数)来识别、描述、支持你所制定的营销策略。

我们针对题目中提到的star ratings, reviews, and helpfulness ratings三个指标进行各自内部的定量分析,同时可视化分析结果。美赛的图表可以做成彩色的,而且尽量多可视化数据,这样会使论文看起来更易读,而且美观。举一个我们的图表为例:

这种图使用wps的话,充一个稻壳会员会有很多的在线图表的模板,都很好看。

然后使用matlab对数据集中review的评论文本进行词频统计,大致粗略的得出一个对review属性的定性分析的云图:

通过这些数据,我们可以做出一些有用的推断,以帮助后续根据所提供数据的内部规则进行建模和深入分析。

然后我们OLS建立回归模型来探究三种属性之间的具体关系,建立的依据是我们找到了亚马逊网站上关于实际评星计算的算法逻辑的描述,发现评星实际是和三个因素有关的:

因此,我们以星级为因变量,三个指标为自变量进行回归,得到helpfulness ratings与评星的相关性最大的结论,然后对这个结论进行分析说明:不管是正面还是负面的评论,被点赞的次数越多,对星级的影响就越大,且负面评论的影响更大。(比赛中的对结论的说明非常重要,就算你的数据得出来的结果不太好,也要把它说的很合理(:з」∠) )

Q2:使用你们的分析来解决以下具体问题和Sunshine公司营销总监的要求:

a.一旦Sunshine公司的三种产品在网上市场销售,基于最有信息量的评级和评论识别关键数据度量,以便Sunshine公司跟踪。

a问题其实是要求我们识别最值得sunshine公司追踪的数据度量。即是一个产品的销量与什么度量最有关;当人们需要购买xx物品的时候,最关注的是这个商品的什么属性。根据题目我们将问题分为评级和评论两个方面。

关于reviews,我们使用NLP(自然语言处理)来处理在线评论,mathematica这个很强大的软件,输入文本可以自动计算出是积极还是消极的情感倾向(或者使用python的snowNLP库也可以得到情感程度)。通过文本情感分析方法并建立情感指数分析模型(论文中以 SRC 指数编制法和消费情感指数编制法为基础,构造在线评论情感指数计算模型),分析消费者对于产品的情感倾向。(参考知网上卷烟在线评论的文本情感分析_杨春晓的论文)

通过网络上对这三类产品通用在意的产品维度,得到每一种产品消费者更注重哪些维度。同样将数据进行可视化,我们选用雷达图进行可视化。

得到消费者更注重微波炉的外观和价格,注重奶嘴的外观和使用体验,注重吹风机的质量和使用感。

关于ratrings,因为都是定量的数据,所以我们直接计算了销量与star ratings and helpful ratings的相关系数(使用matlab或SPSS都能迅速计算出相关系数矩阵),发现销售量与星级之间的相关性不高,而 helpful ratings对销售明显有积极的影响。

b.在每个数据集中识别并讨论基于时间的度量和模式,这些度量和模式可能表明产品在在线市场中的声誉正在增加或减少。

c.确定基于文本的测量方法和基于评级的测量方法的组合,以最好地指示潜在的成功或失败的产品。

我们将B和C问题合并,先找出计算声誉的模型,再预测声誉的变化情况(找到支持论文说明一个产品的成功与声誉息息相关)。

第一步,我们结合文本情感分析的情感指数分析模型和ratings构建产品的在线声誉测量模型,同样参考知网上的论文有一个声誉计算模型,将在线声誉分为和美誉度以及知名度相关。美誉度可以通过数据集中的一系列指标计算,知名度我们根据google趋势(https://trends.google.com/),google趋势代表指定时间内的搜索次数,我们导出相应品牌产品的数据作为知名度。论文中已有的模型计算全是通过定量的指标,我们加上A中求出的情感指数,来对品牌的美誉度进行修正,创新了已有的声誉模型。

第二步,我们利用bp神经网络来对声誉进行基于时间的分析和预测,将数据以月份为单位进行分类,计算每个月份的在线声誉值,然后进行BP神经网络进行预测。matlab中有神经网络工具箱,可以直接根据已给数据选择训练函数进行自动训练。

预测后,记得把数据进行可视化!然后进行一定的分析。

预测到随着时间的发展,所有产品的声誉均会有一定的提升,但对多数产品并不是太明显。经过分析验证,发现我们将数据挖掘和文本情感分析相结合得到的信誉模型可以有效的衡量产品成功与否。

d.特定的星评级是否会引发更多的评论?例如,在看到一系列的低星级评价后,客户更有可能写一些评论吗?

为了分析特定星级是否会引发更多评论,探究特定的评论和特定的星级是否有显著差异,我们使用逐对比较法,看评论和评星两种方式的测量结果是否有显著的差异。

我们将文本评论量化为特定星级,和已有星级数据作差,这样得到的差值在五组数据之间的不同,仅由的商品品质的差异引起,可以排除其他种种因素,因此五组差值服从同一分布。

进行t假设检验(μ=0),得到t小于拒绝域,因此无显著差异。reviews and star ratings具有一致性,则特定星评级会引起更多的评论。

e.基于文本的评论的特定质量描述符,如“热情”、“失望”等,是否与评级水平密切相关?

判断文本的情感是否和评星密切相关,如:评价“失望”,是否会评较低的星级。

a中分析过文本的情感倾向,我们将评论按积极和消极特定质量描述符分为两组,评级水平ratings分为star ratings和helpful ratings两类。将按积极消极分类后的数据分别与star ratings数量和helpful ratings数量绘制箱线图。

结果表明如果带有积极的特定质量描述符则容易获得较高的评分水平,反之亦然。

Q3:给Sunshine公司的市场总监写一封一到两页的信,总结你的团队的分析和结果。包括推荐的结果的具体理由。

这时事先准备好的信的模板就派上了用场,可以将信放在目录之后,正式内容的前面,因为信的内容大致就是我们论文的总结论,这样和摘要放的近一些,可能老师看的时候直接只看摘要、目录和信,就比较方便。同时,信一定不要像摘要一样,写很多详细的分析过程和算法模型,因为看信的人是“市场总监”,要写的让他能看懂。还可以在信中配一些结果的图表,这样会更易读。

我们的信分为了两页,第一页写的是我们通过研究通过奶嘴,吹风机,微波炉这三款产品的顾客online review数据的结论;第二页写的是线上销售策略,包括总的线上销售策略和针对即将上线的三种产品的、分别针对重要维度的提高产品可取性的策略。这时的策略可以上google搜索一下,然后结合自己论文中使贴近结论。

最后是写Strengths and weaknesses和Reference、附录等。优缺点可以参考一下自己借鉴的论文中的提到的优缺点。

最后最重要的就是写摘要!

摘要采取总分的形式,先总写本文运用了…等方法,通过对微波炉,婴儿奶嘴和吹风机三种商品的数据文件中客户提供的评分和评论进行数据分析,帮助阳光公司在线上市场推出新产品时取得成功。(可以摘抄题目要求)

然后分着写每个问题研究的思路和使用的方法以及得到的结论。(为了…,我们…,使用…,得到…。)

写最下面的keywords时,不要写太多,只写最重要的,最好不要超过一行。

论文手写完之后,需要全队(至少是和论文手一起)检查一下全文的格式,图片表格和大致的语法,解题思路是否和建模手说的一样。

之后记得保存数据和所有的过程文档,这样在以后复盘的时候才能想起来。

美赛整体还是比较圆满的,完成的也很快。还是很遗憾没有来得及在保研前参加一次国赛。大家如果有想参加建模的,一定要早点!不要像我一样现在遗憾。

文章来源:部分内容来源于LQW_SCUT

2023美赛报名

2023年美国大学生数学建模竞赛报名正式开始,截止到当前,2023年美赛报名已达1160支队伍。近3400多人报名参赛。

数模乐园作为国内美赛报名最大官方平台

为参加美赛的同学解决国际支付报名难的问题

为同学们省去大部分繁琐流程的同时

还赠纸质证书打印邮寄、美赛赛题解析、美赛专属礼包、赛题翻译等备赛资料

现针对美赛特推出2023年美赛辅助报名!

数模乐园已累计为8.5万同学完成了美赛辅助报名!

通过数模乐园辅助报名流程简单,直接在线缴费报名,使用微信/支付宝即可缴费,无须VISA等国外银行卡,很大程度地方便了学生的报名,报名后队长会收到数模乐园官方美赛报名成功邮件通知。

立即报名

进群获取历年真题及赛前培训资料、赛前资讯

联系方式

进群领取美赛历年培训资料

美赛报名咨询QQ

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
参与俄看守所劫持事件嫌犯已被击毙 2名人质获救

参与俄看守所劫持事件嫌犯已被击毙 2名人质获救

财联社
2024-06-16 17:30:14
湖北设4站,这条高铁要来了

湖北设4站,这条高铁要来了

鲁中晨报
2024-06-16 10:35:05
震惊我了!小沈阳演唱会变身型男,肌肉明显颜值大涨,超显年轻!

震惊我了!小沈阳演唱会变身型男,肌肉明显颜值大涨,超显年轻!

小娱乐悠悠
2024-06-12 16:10:05
S妈称:不要挑拨离间,玥儿和菻菻是我们全家的宝贝,怎么能不管

S妈称:不要挑拨离间,玥儿和菻菻是我们全家的宝贝,怎么能不管

综艺拼盘汇
2024-06-16 17:50:29
医生一再提醒:年纪大了,宁可天天吃猪肉,都不要多吃这2物

医生一再提醒:年纪大了,宁可天天吃猪肉,都不要多吃这2物

今日养生之道
2024-06-12 21:20:53
难踢大赛!30岁迪巴拉只参加过1次世界杯1次美洲杯,出场129分钟

难踢大赛!30岁迪巴拉只参加过1次世界杯1次美洲杯,出场129分钟

直播吧
2024-06-16 13:10:14
令人失望!国足归化目标状态低迷,连续6场0进球,拿顶薪成奢望

令人失望!国足归化目标状态低迷,连续6场0进球,拿顶薪成奢望

国足风云
2024-06-16 21:01:41
纳达尔土豪身份尽显!在法网首轮佩戴800万奢侈手表,无愧三巨头

纳达尔土豪身份尽显!在法网首轮佩戴800万奢侈手表,无愧三巨头

搏击江湖
2024-06-16 10:24:30
重庆农商行女职员表白副行长后续: 单位回应 知情人爆内幕 评论破防

重庆农商行女职员表白副行长后续: 单位回应 知情人爆内幕 评论破防

妮子说美食
2024-06-16 06:53:56
为什么朋友圈很少晒4年级以上的娃,网友评论太真实了

为什么朋友圈很少晒4年级以上的娃,网友评论太真实了

阿康四岁啦
2024-06-15 13:31:38
惊!女子全身乏力一查,一家四口3人“吸血鬼”

惊!女子全身乏力一查,一家四口3人“吸血鬼”

Auroua
2024-06-15 22:43:17
赵丽颖古早黑历史曝光,惊人往事让人不敢相信,疑似没文化还当三

赵丽颖古早黑历史曝光,惊人往事让人不敢相信,疑似没文化还当三

花哥扒娱乐
2024-04-18 22:17:33
马斯克:一面是天才一面是疯子,从小混乱的家庭关系让他无法正常

马斯克:一面是天才一面是疯子,从小混乱的家庭关系让他无法正常

照见古今
2024-01-06 18:43:16
“商砼”的“砼”字不读quán,也不读shuān,那它的正确读音是?

“商砼”的“砼”字不读quán,也不读shuān,那它的正确读音是?

迷局科普
2024-06-14 11:29:09
亲戚送旧家具可以收,唯独这“3样旧物”,不管谁送,都不能收!

亲戚送旧家具可以收,唯独这“3样旧物”,不管谁送,都不能收!

影视评论阿劲
2024-06-16 16:52:25
中国女排最新形势:大战NO.3,冲4连胜保亚洲第1,超美国进TOP5?

中国女排最新形势:大战NO.3,冲4连胜保亚洲第1,超美国进TOP5?

刘姚尧的文字城堡
2024-06-16 06:39:27
洗衣机“快洗”模式需慎用

洗衣机“快洗”模式需慎用

参考消息
2024-06-15 19:12:11
凯特王妃与小夏公主的温情时刻:为女儿捋头发,眼神中全是骄傲

凯特王妃与小夏公主的温情时刻:为女儿捋头发,眼神中全是骄傲

KK说王室
2024-06-16 11:52:03
17岁中专女生爆火!会被大学破格录取?她参加的数学竞赛什么来头?

17岁中专女生爆火!会被大学破格录取?她参加的数学竞赛什么来头?

上观新闻
2024-06-15 22:37:24
林彪取代彭老总位置后,却一再和主席“顶牛”:大不了和彭总一样

林彪取代彭老总位置后,却一再和主席“顶牛”:大不了和彭总一样

燕小姐说历史
2024-06-16 08:48:13
2024-06-16 22:10:44
数模乐园官方
数模乐园官方
专注于数学建模,分享干货知识
1135文章数 793关注度
往期回顾 全部

教育要闻

剑南春2024高考专题报道

头条要闻

牵涉越南“女首富”案 又一位越共中央高层受处分

头条要闻

牵涉越南“女首富”案 又一位越共中央高层受处分

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

科技要闻

iPhone 16会杀死大模型APP吗?

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

家居
旅游
亲子
健康
公开课

家居要闻

空谷来音 朴素留白的侘寂之美

旅游要闻

@毕业生,江苏这些景区可享免票或优惠

亲子要闻

小姨呸了8个月的外甥一口,接下来外甥让小姨明白,谁才是大哥

晚餐不吃or吃七分饱,哪种更减肥?

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版