在计算机领域,“模态”大致意思是“数据类型”,多模态即指多种数据类型。因此,从字面意思理解:多模态AI就是将各种数据类型与多种智能处理算法相结合。
最近也是有一些多模态AI的风口:
去年7月,谷歌推出机器人模型RoboticsTransformer 2(RT-2),这是一个全新的视觉-语言-动作(VLA)模型,从网络和机器人数据中学习,并将这些知识转化为机器人控制的通用指令。
今年3月,机器人初创企业Figure展示了基于OpenAI模型的全尺寸人形机器人Figure 01,机器人动作流畅,所有行为都不是远程操作实现的,而都是机器人学到的,并以正常速度(1.0x)运行。
随着AI大模型向多模态升级,其数据交互多样性与应用场景丰富性为优化用户体验提供了巨大的潜力。
从发展趋势看,多模态大模型在语音、图像和视频等多元输入输出方式中的应用,预示着内容创作领域将发生革命性变革。
多模态模型有望大幅扩展下游应用场景,突破文字交互的局限性,进一步推动工业、医学、汽车、机器人等领域的商业化应用落地,从而不断释放增量空间。
总的来说AI的发展在全球持续爆发,多模态领域的各路厂商不断加速创新和突破,将为全球大模型的发展和应用提供更多可能性。
根据以上逻辑,我也是从“多模态AI”行业筛选出几家潜力黑马股,尤其是最后一家最具爆发潜力。时间会证明我的判断,一起来看看吧。
江南化工
公司持有北京光年无限科技有限公司12.91%股份。经向北京光年无限科技有限公司了解,其在多模态AI领域的重点业务方向包括:智慧家庭、智慧教育、智能制造、特种机器人等。
数字政通
“人和”行业大模型可帮助公司的政务客户提升城市管理和运行的效率, 实现对城市治理、公共安全等关键基础设施进行精准的监测和管理,通过利用语音、 视觉等多模态自动检测、语义分析能力
润和软件
公司推出了以GPT作为基础架构的NLP大模型技术和Diffusion架构技术的多模态大模型技术为核心算法能力的新一代AI中枢平台,可以对接各类大模型。
深城交
构建多模态通用大模型,并融合自主研发的面向离散个体活动链的宏观建模软件TransPlan和面向大规模网络实时在线推演的中微观交通仿真软件TransSim。
最后一家是小编最看好的一家,理由如下:
1.公司在创新业务方面搭建了图片及场景等多模态的 AIGC 数字工具矩阵,完成了虚拟人、虚拟空间、虚拟物等元宇宙创新业务基建。
2.处于底部“黄金坑”,公司市值不足百亿,目前股价仅11元左右,筹码高度集中,股东户连续5期大幅减少。
3.从技术面来看,涨停突破年线,MACD日周月三线金叉,主力高度控盘,有望从5元到55元。
风险提示:本内容仅代表个人观点,仅供参考,不作推荐。市场有风险,投资需谨慎!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.