
![]()
想象一下,一家保险公司能够在几分钟内找出过去十年太平洋西北地区所有与火灾相关的索赔,或者一个销售部门能够收集特定情绪的用户反馈,从而主动改进功能,避免流失潜在客户,这将带来怎样的可能性。利用历史数据为人工智能提供数据,潜在的积极成果数不胜数,但前提是备份不再像备份那样运行。
多年来,从保险到娱乐,各行各业的企业都把旧数据视为积灰的保单——积压起来,希望永远用不上。这些公司创建并存储了海量数据记录、文件和视频,但这些数据几乎从未被公开,除了作为备份或满足合规和监管需求外,几乎没有任何价值。
那么,如果这些数据仍然堆积在数字柜的某个角落,会有什么问题呢?很多数据被搁置肯定是有原因的,对吧?
这种“那又怎样?”的心态忽视了人工智能时代的现实,它彻底改变了消费者对各种服务和体验的期望。在这个时代,企业需要根据人工智能提供的实时洞察采取行动,提供个性化、情境丰富的体验,而所有这些“休眠”数据如今已成为企业中最被低估的战略资产之一。
01
备份停留在过去
在当今快速发展的云优先世界中,备份常常被视为静态的保险政策——公司可以设置、忘记并希望永远不触及。
现实情况要复杂得多,代价也高得多。
可见性是首要弱点。在碎片化的备份生态系统中,资源蔓延、影子IT和标签配置错误,使得难以证明哪些数据真正受到保护,也难以发现哪些数据未受保护。云原生备份工具则进一步加剧了这一挑战,虽然它们易于启用,但往往缺乏真正的可搜索性和单项还原等关键功能。第三方工具试图填补这些空白,但却带来了自身的复杂性,需要在客户环境中部署代理和额外的机器,备份策略配置复杂,并且存在隐藏的定价模式,企业不仅需要为许可证付费,还需要为存储或传输的每个数据单元付费。
当出于合规性、法律或运营需求而需要数据时,这些传统模型的恢复流程就显得力不从心了。大多数工具都需要完整的快照恢复,即使只需要极少量数据也会触发完整的实例恢复。换句话说,即使只有一个表甚至一行数据与他们相关,团队也被迫恢复整个数据库。这会导致巨大的时间、计算能力和成本开销。大多数公司的备份系统缺乏精细的恢复功能,无法绕过这种冗余且浪费的流程。
合规性要求又暴露了另一个痛点。很少有团队能够在审计期间证明实时备份的成功,或证明敏感数据保留策略、加密和访问控制得到妥善应用。在动态的多云世界中,这种情况在最好的情况下会导致数据全面保留和存储容量膨胀,在最坏的情况下会导致敏感数据未经审查和保护而出现缺口。
那些像对待 LTO 或 Glacier 等被动归档一样对待备份的组织面临着云速度与备份就绪性之间日益扩大的差距。如果没有自动发现或分类,即使在高度动态的环境中,数据也可能出现疏漏。备份仍然不完整或不一致,而为了扑灭由此引发的火灾,支出却持续飙升。
02
从备份到数据湖:
解锁人工智能的下一个前沿
仅仅“现代化”存储并不能开启数据战略的新时代。相反,企业必须将其备份转化为完全可搜索、可分析的数据湖——不仅要满足合规性和恢复需求,还要为当今的人工智能模型提供大规模学习和有效运行所需的海量高质量数据集。
在数据湖模型中,备份不再只是静态快照。它们将成为动态存储库,包含丰富的上下文元数据、索引以进行细粒度搜索,并连接到分析工具。它们不仅满足灾难恢复和合规性要求,还能积极促进商业智能、产品创新和客户互动。
推动这一转变的关键因素包括:
自动化、上下文数据提取:借助人工智能驱动的标记和自然语言处理,历史记录、文档、图像和视频可以用丰富的可搜索描述符进行注释。
粒度恢复功能:公司无需隔离整个数据集,而是可以在几秒钟内精确检索单个文件、交易、表格或媒体剪辑,而不会破坏更广泛的数据集。
无缝集成到分析管道:一旦备份可搜索和查询,它们就可以直接输入到 AI 训练数据集、实时仪表板和趋势分析工作流程中。
其影响是变革性的。例如,银行可以利用十年来的长期静态交易数据来训练欺诈检测算法,从而发现在较小样本中难以发现的异常。医疗保健提供商可以类似地检索所有与特定基因标记匹配的患者病例以支持研究;娱乐公司可以展示历史观众情绪数据来指导内容制作。
曾经的“死数据”如今已成为一项不断增长的战略资产。备份不再是成本中心,而是发展成为一项竞争优势,推动着各行各业的创新。
03
挖掘“死数据”的商业潜力
幸运的是,现状正在改变。现代存储系统已经可以整合基于对象和主题的存储、自动索引以及上下文元数据提取,从而使档案可立即搜索并随时可用于业务。
例如,谷歌云一直与福特和京瓷等大型制造商和汽车公司合作,连接历史上孤立的资产,处理和标准化数据,并提高从工厂车间到云端的可见性。金融机构积累了数PB的交易和客户互动数据,它们渴望利用这一“金矿”来训练金融专用的AI模型,这凸显了深度历史数据的价值。
即使在媒体和娱乐领域,用例也具有惊人的潜力。以 Netflix 为例,其今年在原创和授权内容上的支出预计将达到 180 亿美元。换句话说,Netflix 坐拥大量的备份数据、媒体、元数据、视频标记信息等,所有这些都必须通过一系列区域合规法规、众多可访问性标准和各种不同的云提供商进行处理。在单个备份恢复快照中搜索如此惊人的内容量根本不可行。现在,想象一下,如果使用细粒度的恢复功能和即时搜索能力,筛选数据会变得多么容易。
这正是数据湖转变所能实现的。
证明在于输出:有了正确的工具和正确的战略思维,备份存储就成为一种创造性的增值引擎,而不仅仅是一种保险政策。
04
更好的备份意味着更好的业务成果
如今,企业的定义取决于数据和速度。传统的备份系统在这两方面都阻碍着团队的发展。
备份不应被视为保险库或最糟糕的生存机制。相反,它们应该成为增长、创造力和竞争优势的引擎,而新的技术解决方案正蓄势待发,助力实现这一转变。今天实现备份架构现代化的公司,将成为未来金融、医疗、媒体等领域突破的推动者。
免责声明:
本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系删除。所有信息不构成任何投资建议,加密市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。
设为星标 避免错过
虚拟世界没有旁观者,每个点赞都是创造历史的像素
关注我,一起探索AWM⁺
2025-08-15
2025-08-14
2025-08-13
商业赞助
![]()
点击下方 “目录” 阅读更多
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.