网易首页 > 网易科技 > 创业频道 > 正文

如何打造一只投资界的阿法狗

0
分享至

(原标题:如何打造一只投资领域的阿法狗?)

编者按:本文作者袁峻峰,复旦金融学硕士,FRM 金融风险管理师。目前在民生银行从事个人客户金融大数据分析。交流探讨可联系其邮箱 yuanjunfeng_fr@163.com。

在 AlphaGo 战胜人类围棋顶尖高手之际,本文简单探讨了投资 AlphaGo 系统模块与训练数据以及可行性。并将其实现逻辑与郝伯特·西蒙过程理性算法比较。文章最后讨论了如何应用投资 AlphaGo 系统为人类服务。

细想一下,围棋和投资有很多类似的地方,围棋是在和对手博弈,投资可看作是在和市场博弈。围棋是在 19*19 的棋盘上选择,如果是国内 A 股市场,那投资组合是在 2800 多只股票上做选择。围棋胜负在于最终盘面优势,投资则在意周期最终收益。

如何打造一只投资领域的阿法狗

所以可以假设:

在股票市场,每天调整持仓为一次行动,该行动是个人根据股票特征,市场特征的环境下作出的决策。以一年为期限,一个样本大约是 250 周期,期末统计相关指标。

目标:正样本为年化收益率,收益波动率,最大回撤,夏普率,胜率等综合指标较优样本,为胜。反之为负样本,为负。

假设我们已有合适与金融领域的 AlphaGo 系统,主要模块参考田渊栋博士的描述 [6]:

1. 策略网络(Policy Network),给定当前头寸与市场条件,预测下一步的持仓策略集合。

2. 估值网络(Value Network),给定当前头寸与市场条件,预测该持仓策略胜负。

3. 蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),博弈选择搜索,结合以上两模型决定下一步持仓策略。

对比下郝伯特·西蒙过程理性算法描述 [2] [8]:

第一步,行为主体设想自己的可选方案集合,

第二步设想可选方案集合的可能后果集合。

第三步,第四步,评估可能后果集合的概率,并因为局部有序法则,可量化满意度既回报值。

第五步,从可能后果集合中,根据预期目标,选择满意的可能后果集合子集。

第六步,从可选方案集合中选择满意的可能后果集合子集对应的方案。

可以发现 AlphaGo 系统逻辑和郝伯特·西蒙过程理性算法基本上是一致的。

接下来,我们来讨论样本数据,假设我们能不受限的的得到需要的数据。

基础数据包括,个人客户历史持仓,股票历史截面数据,市场历史截面数据,具体数据描述请参见文章 [7],关于样本集的选取,我认为有个关键问题,是选用全部客户的交易记录,还是选用专业投资人以及投资高手的交易记录。田渊栋博士也说 “没有千年来众多棋手在围棋上的积累,就没有围棋 AI 的今天。”[6] 根据其描述,棋手应该是段位以上围棋专业棋手。所以我认为也应该选取专业投资人的交易记录。

关于策略网络(Policy Network),本人还没找到相关训练样本数据描述。由于其是深度强化学习网络(Deep Reinforcement Learning Network),根据以前看到的高频交易强化学习案例,初步设想是将每日持仓变化作为行动,关联股票和市场数据作为状态,回报函数是收益等统计值,学习目标是函数是当期是否为之前描述的正样本。欢迎讨论。

估值网络(Value Network)训练样本,即是用于对深度卷积神经网络 DCNN 训练。田渊栋博士对样本数据的描述是 “每一盘棋只取一个样本来训练以避免过拟合,不然对同一对局而言输入稍有不同而输出都相同,对训练是非常不利的。这就是为什么需要三千万局,而非三千万个盘面的原因。”[6] 由于每人每一年交易行为样本对应一盘棋,同样只随机取其中一天持仓以及关联股票和市场数据作为训练数据,让估值网络预测最终胜负以训练深度卷积神经网络。“需要三千万局自我对局”[6] 那意味着 3000 万次系统回朔测试 Back Test,以优化估值网络。

至此,我们就得到战无不胜的投资版 AlphaGo 系统。田渊栋博士文章中还说到 “他们完全没有做任何局部死活 / 对杀分析,纯粹是用暴力训练法训练出一个相当不错的估值网络。这在一定程度上说明深度卷积网络(DCNN)有自动将问题分解成子问题,并分别解决的能力。”[6] 既是说虽然 AlphaGo 系统训练过程中使用了大量棋手对局样本,但也就止于此,并没有其他围棋领域知识。

这点着实让人可恼,我们之前利用计算机都是我们提供数据结构和算法,计算机执行。后来软件设计发展到面向对象,也是为了更好的和领域知识相对应。但现在,只要我们提供数据与规则目标,计算机已经可以在围棋这样需要直觉的人类游戏中胜出了。正如图灵奖得主吉姆·格雷留给世人的最后一次演讲《科学方法的革命》中说: “随着数据的爆炸性增长,计算机将不仅仅能做模拟仿真,还能进行分析总结,得到理论。数据密集范式理应从第三范式中分离出来,成为一个独特的科学研究范式。” 即第四范式。虽然现在 AlphaGo 系统做的还是人类算法的模拟仿真。

但想想也不用太担心,围棋的规则是固定的,但金融的规则可不是固定的。正如伊曼纽尔·德曼教授所说 “物理是与上帝较量,上帝不会经常改变规则,金融却是与上帝创造的人较量”[4]。还好我们还有杀手锏,如熔断机制,很轻松就可以碾压 AlphaGo 系统,让其做的所有训练无效。另外如何界定数据边界,信息收集成本等问题,都可以让我们不用太担心投资版 AlphaGo 系统。

最后,我们来探讨如何更好的使用 AlphaGo 系统为人类服务。李喆六段在评价李世石两盘棋说:“AlphaGo 给出选点的思维方式与人类不同,但我们却可以用人类的方式去理解它,这是一件多么美妙的事情。”[10] 围棋欧洲冠军樊麾也提到 “AlphaGo 就像是日本漫画《棋魂》里的主人公「佐为」。”[9] 学棋之人,家里有个佐为,是件多么美妙的事。

回顾下金融个性化推荐中股票购买概率预测模型的 “基本假设:客户每日的持仓,是基于当时金融市场情景以及股票属性作出决策的独立事件。”[7] 这些决策都是理性决策吗?答案当然是否定的。希勒教授说过 “设计新型风险管理基础架构的第一步就是充分认识人类在决策过程中意志薄弱的天性” [5]。例如实验证明 “收益增量带来的快乐强度大约在增量的 0.5-1 倍之间,而因损失增量而产生的痛苦大约是增量的 2.5 倍。” [2] AlphaGo 系统当然是理性的,没有情感的,但人如何利用其增加自身决策中的理性呢?斯宾诺莎说过 “只要心灵理解一切事物都是必然的,那么它控制情感的力量便越大”。 [3] 借助投资版 AlphaGo 系统的分析可以帮助人们更加理性的决策。如何利用机器学习辅助人类更加理性的决策将是值得长期探索的问题。

参考文献:

[1] 汪丁丁.行为金融学基本问题 [J].财经问题研究.2010,7 .

[2] 汪丁丁. 行为经济学要义 [M]. 世纪文景,上海人民出版社.2015,10.

[3] 斯宾诺莎. 伦理学 [M]. 商务印书馆.1998,01 .

[4] 伊曼纽尔·德曼. 失灵 [M]. 中信出版社.2013,10.

[5] 罗伯特·希勒. 新金融秩序[M].中信出版社.2013,11.

[6] 田渊栋. AlphaGo 的分析[OL].知乎 专栏文章.2016-02-29.

[7] 袁峻峰. 大数据下客户金融产品购买概率预测 [OL].大数据文摘,量化派 等 (公众号). 2016-02-19.

[8] 郝伯特·西蒙. 现代决策理论的基石 [M]. 北京经济学院出版社.1989.

[9] 赵巍,赵云峰,Rita. 专访樊麾: AlphaGo 会发现一种人类想象不到的围棋之美 [OL] . 机器之心 (公众号). 2016-03-08.

[10] 李喆. 这两盘棋 没人会比李世石做得更好![OL] . 喆理围棋 (公众号). 2016-03-11.

相关推荐
热点推荐
中央定调,2026年满60岁可退休!累计缴费15年可以领取养老金吗?

中央定调,2026年满60岁可退休!累计缴费15年可以领取养老金吗?

王五说说看
2025-12-15 06:52:10
2025 SUV销量榜,特斯拉Model Y再夺冠,新势力们为何反而越追越远

2025 SUV销量榜,特斯拉Model Y再夺冠,新势力们为何反而越追越远

91cheche
2025-12-12 16:03:04
马云的预言要成真?如果不出意外的话,2026年房价要迎来三大转变

马云的预言要成真?如果不出意外的话,2026年房价要迎来三大转变

法老不说教
2025-11-29 22:29:18
山东2家大型医院破产了!

山东2家大型医院破产了!

莱芜福禧今日信息
2025-12-15 06:32:31
宁波通报患儿手术后离世

宁波通报患儿手术后离世

新京报
2025-12-14 20:06:30
杨子直播曝猛料,即将和黄圣依复合,除了我,她看不上别的男人!

杨子直播曝猛料,即将和黄圣依复合,除了我,她看不上别的男人!

心静物娱
2025-12-12 14:18:14
情况已变复杂,中国发布重要通告,呼吁90万在日中国公民完成登记

情况已变复杂,中国发布重要通告,呼吁90万在日中国公民完成登记

叮当当科技
2025-12-15 01:04:42
连续9次!曼联再遇苦主,2次主场0-3,阿莫林保密工作相当好

连续9次!曼联再遇苦主,2次主场0-3,阿莫林保密工作相当好

嗨皮看球
2025-12-15 12:58:56
年过八旬富豪赵世曾有个怪癖,只要女友一怀孕,立马就和她们分手

年过八旬富豪赵世曾有个怪癖,只要女友一怀孕,立马就和她们分手

百态人间
2025-12-13 16:15:24
“可以举报了!”妈妈晒儿子考公上岸照,网友发现重要信息!

“可以举报了!”妈妈晒儿子考公上岸照,网友发现重要信息!

知晓科普
2025-12-09 10:30:05
“00后”创二代出任韵达董事,为公司实控人聂腾云夫妇之子

“00后”创二代出任韵达董事,为公司实控人聂腾云夫妇之子

界面新闻
2025-12-15 10:44:06
比黄岩岛更狠!驻守338天挤走对手,这块"长出来"的陆地到底多重要

比黄岩岛更狠!驻守338天挤走对手,这块"长出来"的陆地到底多重要

科普100克克
2025-12-08 14:21:29
活久见!全网最有种的儿媳!偷走婆婆43万,带闺蜜去KTV挥霍一空

活久见!全网最有种的儿媳!偷走婆婆43万,带闺蜜去KTV挥霍一空

火山詩话
2025-12-13 17:04:04
马王堆挖出的神秘图纸,竟是古人“长寿秘籍”,老祖宗练了2000年!

马王堆挖出的神秘图纸,竟是古人“长寿秘籍”,老祖宗练了2000年!

书法网
2025-12-05 18:06:32
狂轰5比1和5比0!五星巴西打出王者风范,美加墨世界杯夺第六冠?

狂轰5比1和5比0!五星巴西打出王者风范,美加墨世界杯夺第六冠?

阿晞体育
2025-12-15 09:54:17
如果能从所有邻国中选一个加入我国,你希望选谁?

如果能从所有邻国中选一个加入我国,你希望选谁?

全城探秘
2025-12-15 12:35:06
我妈藏了30年的助眠土方!60岁每天一觉到天亮,失眠的赶紧收藏

我妈藏了30年的助眠土方!60岁每天一觉到天亮,失眠的赶紧收藏

江江食研社
2025-12-15 07:30:07
俄方宣布成立敖德萨共和国,吞并阴影再现,谁将成为下一个?

俄方宣布成立敖德萨共和国,吞并阴影再现,谁将成为下一个?

健身狂人
2025-12-15 11:48:03
某光伏企业被堵门讨薪!

某光伏企业被堵门讨薪!

新浪财经
2025-12-14 18:36:58
克林顿:我一生有两件事感到很遗憾,一中国加入WTO,二我做错了

克林顿:我一生有两件事感到很遗憾,一中国加入WTO,二我做错了

趣文说娱
2025-07-24 17:22:53
2025-12-15 13:51:00

科技要闻

平价数码产品,要和我们说再见了?

头条要闻

悉尼枪手父亲被击毙儿子被制服 愤怒民众猛踩头部

头条要闻

悉尼枪手父亲被击毙儿子被制服 愤怒民众猛踩头部

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

黄绮珊在何晴去世首发,10年悄悄祈福

财经要闻

新会陈皮乱象曝光:产地造假、年份速成

汽车要闻

二排有大屏还有高阶辅助驾驶 风云T9L明年一季度上市

态度原创

艺术
房产
本地
游戏
公开课

艺术要闻

Gustav Klimt 高清风景油画作品集

房产要闻

6.66亿摘地,海南封关大动作,千亩海澄新城震撼登场

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

酒越陈越香 《生化危机:安魂曲》中里昂是一位帅大叔

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×