网易首页 > 网易科技 > 创业频道 > 正文

如何打造一只投资界的阿法狗

0
分享至

(原标题:如何打造一只投资领域的阿法狗?)

编者按:本文作者袁峻峰,复旦金融学硕士,FRM 金融风险管理师。目前在民生银行从事个人客户金融大数据分析。交流探讨可联系其邮箱 yuanjunfeng_fr@163.com。

在 AlphaGo 战胜人类围棋顶尖高手之际,本文简单探讨了投资 AlphaGo 系统模块与训练数据以及可行性。并将其实现逻辑与郝伯特·西蒙过程理性算法比较。文章最后讨论了如何应用投资 AlphaGo 系统为人类服务。

细想一下,围棋和投资有很多类似的地方,围棋是在和对手博弈,投资可看作是在和市场博弈。围棋是在 19*19 的棋盘上选择,如果是国内 A 股市场,那投资组合是在 2800 多只股票上做选择。围棋胜负在于最终盘面优势,投资则在意周期最终收益。

如何打造一只投资领域的阿法狗

所以可以假设:

在股票市场,每天调整持仓为一次行动,该行动是个人根据股票特征,市场特征的环境下作出的决策。以一年为期限,一个样本大约是 250 周期,期末统计相关指标。

目标:正样本为年化收益率,收益波动率,最大回撤,夏普率,胜率等综合指标较优样本,为胜。反之为负样本,为负。

假设我们已有合适与金融领域的 AlphaGo 系统,主要模块参考田渊栋博士的描述 [6]:

1. 策略网络(Policy Network),给定当前头寸与市场条件,预测下一步的持仓策略集合。

2. 估值网络(Value Network),给定当前头寸与市场条件,预测该持仓策略胜负。

3. 蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),博弈选择搜索,结合以上两模型决定下一步持仓策略。

对比下郝伯特·西蒙过程理性算法描述 [2] [8]:

第一步,行为主体设想自己的可选方案集合,

第二步设想可选方案集合的可能后果集合。

第三步,第四步,评估可能后果集合的概率,并因为局部有序法则,可量化满意度既回报值。

第五步,从可能后果集合中,根据预期目标,选择满意的可能后果集合子集。

第六步,从可选方案集合中选择满意的可能后果集合子集对应的方案。

可以发现 AlphaGo 系统逻辑和郝伯特·西蒙过程理性算法基本上是一致的。

接下来,我们来讨论样本数据,假设我们能不受限的的得到需要的数据。

基础数据包括,个人客户历史持仓,股票历史截面数据,市场历史截面数据,具体数据描述请参见文章 [7],关于样本集的选取,我认为有个关键问题,是选用全部客户的交易记录,还是选用专业投资人以及投资高手的交易记录。田渊栋博士也说 “没有千年来众多棋手在围棋上的积累,就没有围棋 AI 的今天。”[6] 根据其描述,棋手应该是段位以上围棋专业棋手。所以我认为也应该选取专业投资人的交易记录。

关于策略网络(Policy Network),本人还没找到相关训练样本数据描述。由于其是深度强化学习网络(Deep Reinforcement Learning Network),根据以前看到的高频交易强化学习案例,初步设想是将每日持仓变化作为行动,关联股票和市场数据作为状态,回报函数是收益等统计值,学习目标是函数是当期是否为之前描述的正样本。欢迎讨论。

估值网络(Value Network)训练样本,即是用于对深度卷积神经网络 DCNN 训练。田渊栋博士对样本数据的描述是 “每一盘棋只取一个样本来训练以避免过拟合,不然对同一对局而言输入稍有不同而输出都相同,对训练是非常不利的。这就是为什么需要三千万局,而非三千万个盘面的原因。”[6] 由于每人每一年交易行为样本对应一盘棋,同样只随机取其中一天持仓以及关联股票和市场数据作为训练数据,让估值网络预测最终胜负以训练深度卷积神经网络。“需要三千万局自我对局”[6] 那意味着 3000 万次系统回朔测试 Back Test,以优化估值网络。

至此,我们就得到战无不胜的投资版 AlphaGo 系统。田渊栋博士文章中还说到 “他们完全没有做任何局部死活 / 对杀分析,纯粹是用暴力训练法训练出一个相当不错的估值网络。这在一定程度上说明深度卷积网络(DCNN)有自动将问题分解成子问题,并分别解决的能力。”[6] 既是说虽然 AlphaGo 系统训练过程中使用了大量棋手对局样本,但也就止于此,并没有其他围棋领域知识。

这点着实让人可恼,我们之前利用计算机都是我们提供数据结构和算法,计算机执行。后来软件设计发展到面向对象,也是为了更好的和领域知识相对应。但现在,只要我们提供数据与规则目标,计算机已经可以在围棋这样需要直觉的人类游戏中胜出了。正如图灵奖得主吉姆·格雷留给世人的最后一次演讲《科学方法的革命》中说: “随着数据的爆炸性增长,计算机将不仅仅能做模拟仿真,还能进行分析总结,得到理论。数据密集范式理应从第三范式中分离出来,成为一个独特的科学研究范式。” 即第四范式。虽然现在 AlphaGo 系统做的还是人类算法的模拟仿真。

但想想也不用太担心,围棋的规则是固定的,但金融的规则可不是固定的。正如伊曼纽尔·德曼教授所说 “物理是与上帝较量,上帝不会经常改变规则,金融却是与上帝创造的人较量”[4]。还好我们还有杀手锏,如熔断机制,很轻松就可以碾压 AlphaGo 系统,让其做的所有训练无效。另外如何界定数据边界,信息收集成本等问题,都可以让我们不用太担心投资版 AlphaGo 系统。

最后,我们来探讨如何更好的使用 AlphaGo 系统为人类服务。李喆六段在评价李世石两盘棋说:“AlphaGo 给出选点的思维方式与人类不同,但我们却可以用人类的方式去理解它,这是一件多么美妙的事情。”[10] 围棋欧洲冠军樊麾也提到 “AlphaGo 就像是日本漫画《棋魂》里的主人公「佐为」。”[9] 学棋之人,家里有个佐为,是件多么美妙的事。

回顾下金融个性化推荐中股票购买概率预测模型的 “基本假设:客户每日的持仓,是基于当时金融市场情景以及股票属性作出决策的独立事件。”[7] 这些决策都是理性决策吗?答案当然是否定的。希勒教授说过 “设计新型风险管理基础架构的第一步就是充分认识人类在决策过程中意志薄弱的天性” [5]。例如实验证明 “收益增量带来的快乐强度大约在增量的 0.5-1 倍之间,而因损失增量而产生的痛苦大约是增量的 2.5 倍。” [2] AlphaGo 系统当然是理性的,没有情感的,但人如何利用其增加自身决策中的理性呢?斯宾诺莎说过 “只要心灵理解一切事物都是必然的,那么它控制情感的力量便越大”。 [3] 借助投资版 AlphaGo 系统的分析可以帮助人们更加理性的决策。如何利用机器学习辅助人类更加理性的决策将是值得长期探索的问题。

参考文献:

[1] 汪丁丁.行为金融学基本问题 [J].财经问题研究.2010,7 .

[2] 汪丁丁. 行为经济学要义 [M]. 世纪文景,上海人民出版社.2015,10.

[3] 斯宾诺莎. 伦理学 [M]. 商务印书馆.1998,01 .

[4] 伊曼纽尔·德曼. 失灵 [M]. 中信出版社.2013,10.

[5] 罗伯特·希勒. 新金融秩序[M].中信出版社.2013,11.

[6] 田渊栋. AlphaGo 的分析[OL].知乎 专栏文章.2016-02-29.

[7] 袁峻峰. 大数据下客户金融产品购买概率预测 [OL].大数据文摘,量化派 等 (公众号). 2016-02-19.

[8] 郝伯特·西蒙. 现代决策理论的基石 [M]. 北京经济学院出版社.1989.

[9] 赵巍,赵云峰,Rita. 专访樊麾: AlphaGo 会发现一种人类想象不到的围棋之美 [OL] . 机器之心 (公众号). 2016-03-08.

[10] 李喆. 这两盘棋 没人会比李世石做得更好![OL] . 喆理围棋 (公众号). 2016-03-11.

相关推荐
热点推荐
中组部:公职人员退休后未经批准经商(包括当律师)的,不再保留党政机关退休金等待遇

中组部:公职人员退休后未经批准经商(包括当律师)的,不再保留党政机关退休金等待遇

新浪财经
2025-11-18 12:46:38
脑梗“偏爱”中国人?80%患者都缺一种维生素!

脑梗“偏爱”中国人?80%患者都缺一种维生素!

孟大夫之家1
2025-12-02 19:46:07
1-2!武汉女足冠军杯遭逆转+加时被绝杀 无缘过招欧冠霸主阿森纳

1-2!武汉女足冠军杯遭逆转+加时被绝杀 无缘过招欧冠霸主阿森纳

我爱英超
2025-12-15 05:31:28
“我可是新加坡人!”巴士阿叔怒吼外籍青年,全网围观8万次,网友吵翻了!

“我可是新加坡人!”巴士阿叔怒吼外籍青年,全网围观8万次,网友吵翻了!

新加坡眼
2025-12-14 18:40:59
升温!升温!成都最高温将达16℃

升温!升温!成都最高温将达16℃

掌上金牛
2025-12-15 13:27:07
评论丨小学生写信送别“转学”同学,死亡教育不能止于善意回避

评论丨小学生写信送别“转学”同学,死亡教育不能止于善意回避

红星新闻
2025-12-13 17:14:17
分析100个出轨案例发现,50岁后频繁出轨的女人,有3个共性

分析100个出轨案例发现,50岁后频繁出轨的女人,有3个共性

我的琪琪美玉
2024-02-23 13:04:06
经国务院、中央军委同意,国务院办公厅、中央军委办公厅印发《兵役登记工作规定》

经国务院、中央军委同意,国务院办公厅、中央军委办公厅印发《兵役登记工作规定》

新京报政事儿
2025-12-15 17:21:47
曝文章带新女友见家长!酒喝多到随地乱吐,文妈妈嫌弃表情太抢镜

曝文章带新女友见家长!酒喝多到随地乱吐,文妈妈嫌弃表情太抢镜

柠檬有娱乐
2025-12-15 14:00:46
军舰穿越台海,越南外交部:台海是“国际水域”,不是中国内水

军舰穿越台海,越南外交部:台海是“国际水域”,不是中国内水

影孖看世界
2025-12-13 21:31:29
中方一句“东倭”,吓坏日本右翼?前驻华大使急呼:该卧薪尝胆了

中方一句“东倭”,吓坏日本右翼?前驻华大使急呼:该卧薪尝胆了

近史博览
2025-12-15 14:43:10
日本巨头中国工厂停产,3.5万员工铁饭碗破灭

日本巨头中国工厂停产,3.5万员工铁饭碗破灭

似水流年忘我
2025-12-08 10:56:29
疯了!单场4红牌!豪门15轮不胜+垫底!赛后全队沉默抗议

疯了!单场4红牌!豪门15轮不胜+垫底!赛后全队沉默抗议

足球大号
2025-12-15 14:58:49
人气女优翼舞接受采访:对弟弟坦白时无法忘记那张脸

人气女优翼舞接受采访:对弟弟坦白时无法忘记那张脸

随波荡漾的漂流瓶
2025-12-15 17:20:05
无业男戏瘾上身扮民警12年,高升至公安局副局长,因百万借款露馅

无业男戏瘾上身扮民警12年,高升至公安局副局长,因百万借款露馅

历史品鉴仓
2025-12-12 17:02:56
彩虹-7成功首飞,它的“隐身”到底有多彻底?

彩虹-7成功首飞,它的“隐身”到底有多彻底?

牲产队2026
2025-12-15 17:34:43
中到大雪!小到中雪!吉林省将迎大范围降雪!

中到大雪!小到中雪!吉林省将迎大范围降雪!

吉刻新闻
2025-12-15 15:47:49
快船113-115火箭!无奈不是3连败,是哈登赛后谈杜兰特,他真羡慕

快船113-115火箭!无奈不是3连败,是哈登赛后谈杜兰特,他真羡慕

巴叔GO聊体育
2025-12-15 16:47:24
通缩来了,现在手握大量现金的人,已经在偷偷乐,4个原因很真实

通缩来了,现在手握大量现金的人,已经在偷偷乐,4个原因很真实

猫叔东山再起
2025-12-15 09:35:10
著名演员程之,从发病到去世仅20分钟,主持人儿子比他更有名

著名演员程之,从发病到去世仅20分钟,主持人儿子比他更有名

小熊侃史
2025-12-10 07:05:13
2025-12-15 18:16:49

科技要闻

大佬冷酷预言:未来15年 人形机器人成废铁

头条要闻

悉尼枪击案后以总理猛批澳领导人 澳大利亚总理发声

头条要闻

悉尼枪击案后以总理猛批澳领导人 澳大利亚总理发声

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

何晴告别式现场,前夫许亚军双眼泛红?

财经要闻

新农合涨到400元 农民断缴背后的扎心真相

汽车要闻

主驾配按摩还可选6座 新款捷途X90PRO售13.59万起

态度原创

教育
房产
亲子
家居
公开课

教育要闻

我是吉林历史类考生,600分能上东北的哪些985高校?

房产要闻

6.66亿摘地,海南封关大动作,千亩海澄新城震撼登场

亲子要闻

一年一度圣诞礼物终于来啦!筹备整整一个月,折扣和情绪价值我都要!

家居要闻

温暖色调 大空间不冷清

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×