大数据虽然是现代人创造出来的技术,但其实古代早就有“大数据”的思想了。尤其是我们中国古代的优秀诗人们,基本上都是“大数据”高手。
因为从计算机科学角度来看,“写诗”其实是一个典型的“大数据分析与综合”的过程。先人们早就知道“熟读唐诗三百首,不会吟诗也会吟”。这其实就是大数据综合!“综合”越好,诗的水平就越高。
关于分析,最广为人知的典故,该算贾岛的“僧推月下门”或“僧敲月下门”了。但是,由于缺乏有力的分析工具,也由于样本太小,因此,自古以来,诗词的分析过程都仅仅限于局部,比如,是“推”还是“敲”。
“分析”是“综合”的基础。反过来,大量“综合”知识的积累,又有利于提高“分析”的精准度,从而大大改善“综合”的结果。
我们来看看“大数据诗词分析专家”苏轼是怎么操作的。苏轼曾写过这样的一首词:
南乡子 集句
怅望送春杯,渐老逢春能几回。
花满楚城愁远别,伤怀,何况清丝急管催。
吟断望乡台,万里归心独上耒。
景物登临闲始见,徘徊,一寸相思一寸灰。
其实这首词苏轼自己只写了“伤怀”和“徘徊”四个字,其它的句子都是从“数据库”里面找来的。“怅望送春杯”,起笔取杜牧《惜春》诗句;“渐老逢春能几回”取杜甫漂泊成都时所做的《绝句漫兴九首》之句。“花满“句取自许浑《竹林寺别友人》诗 。“何况”句见刘禹锡《洛中送韩七中丞之吴兴口号》五首其三,“吟断”句见李商隐《晋昌晚归马上赠》诗,“万里”句见许浑《冬日登越王台怀归》诗,“景物”句见杜牧《八月十二日得替后移居霅溪馆因题长句四韵》诗,“一寸”句见李商隐《无题》诗。
在这首词里,苏轼完全变身为一种大数据算法,从浩瀚的诗词文章大数据中寻章摘句,连缀成篇。他知道挖掘最准确的字句,把它们放在最恰当的位置,表达最幽微的思绪。寻章摘句并不难,难的是以画龙点睛的手法,将别人的字句用得仿若己出。我们常说互联网的本质是一种聚合创新,其实读书写作的本质也是一种聚合创新,苏轼玩起来得心应手,游刃有余。
也许你会说苏轼极富想象力和创造力,他也有很多原创的作品,不完全是一名大数据算法师。好,接下来让我们看看他流传最广的一首词:
水调歌头 丙辰中秋,欢饮达旦,大醉。作此篇,兼怀子由
明月几时有?把酒问青天。
不知天上宫阙,今夕是何年。
我欲乘风归去,又恐琼楼玉宇,高处不胜寒。
起舞弄清影,何似在人间?
转朱阁,低绮户,照无眠。
不应有恨,何事长向别时圆?
人有悲欢离合,月有阴晴圆缺,此事古难全。
但愿人长久,千里共婵娟。
此词当然是苏轼的原创,但仔细看来,其实也是无一句无出处。“明月”句典出李白《把酒问月》,“不知”句典出韦瓘《周秦行纪》,“乘风”句典出《列子》,“琼楼玉宇”句典出晋王嘉《拾遗记》,“起舞弄清影”句典出李白《月下独酌》,“婵娟”句典出许浑《怀江南同志》。
这是一种更高级的大数据算法,其创作的基础仍然是他脑中的诗词文章大数据,苏轼仍然从中寻找摘句,只不过这一次,他不是简单地排列,而是进行深度创造,将你知道的数据原型巧妙化用,完美呈现,自成清凉高远之境界。
说了那么多典籍,谈了那么多出处,讲了那么多算法,其实对于普通读者来说,I do not care,我只关心这首诗词好不好看,读完能不能给我带来美妙的感受,当我陷入某种情绪时,这首诗词能不能帮我抒发。
因此,站在用户的角度来看,用户并不关心大数据背后的算法多么精妙,只关心他要的应用,界面是否亲切,能不能给我带来美妙的用户体验,更重要的能否帮我解决实际问题。我们现代人在设计大数据产品的时候,也应该遵循这个规则。
如果说大数据是一座庞大的冰山的话,那么用户只关心浮出海面的那一点点。这就需要真正的大数据专家对数据进行挖掘分析,深度创造,化繁为简,完美呈现。这其中的难度,不亚于读过万卷书后,先写下一万字的长篇,再把一万字删减为一千字的短文,再把一千字凝练为一首不到五十字的小诗。
每一个诗人都是大数据算法师,而一个真正的大数据算法师必然是诗人。如今的时代强烈呼唤大数据算法师的出现,但一切算法的基础都是大数据,百行百业的数据目前并不是完全公开的,也不是互通的,一般人根本看不见。试想,苏轼们如果无法博览群书,无法沉浸在诗词文章的大数据中,他们又怎能写出流传千古的诗词呢?所以只有百行百业先做好数据积累并开放数据,我们才能看到风格多样的算法师大量涌现。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.