
北京2026年5月19日--最近,IBM策动院与英伟达(NVIDIA)、三星共同展示了一项本色感知存储系统(contentawarenessstorage)[1]。该系统在单台职业器上奏凯支握千亿级别向量的存储与检索,平均查询延伸为694毫秒,调回精度达90%。系统硬件组合为IBMStorageScaleSystem6000全闪存建设、六颗英伟达H200GPU以及48块三星30.72TB容量的PCIeGen5NVMe固态硬盘。IBMStorageScaleSystem6000全闪存建设将计算与存储解耦,并通过英伟达H200GPU加快索引重建,将正本基于CPU需耗时数小时的索引构建过程,裁减至GPU上的数分钟。

浮松“1%数据困局”,让AI走向数据
咱们一说念来望望IBM是如何用单机兑现了当今大集群才能兑现的收尾。
今天,大模子版块平均数天便迎来一次更新,RAG(检索增强生成)已成为挖掘非结构化数据价值的中枢。企业CIO巨额濒临中枢课题:如何借助通用东说念主工智能(AI)与AI智能体兑现日常运营提效?如何依托现存IT资源输出精确、高价值的业务决策?
高质地AI嘱托的中枢前提,是模子可高效触达原始着实数据,而检索增强生成(RAG)恰是优化推理成果、进步嘱托准确性与时效性的枢纽时刻。联系词,当向量数据量激增至数十亿级别时,CIO们濒临到了传统全内存向量索引有缠绵的容量与老本逆境。飞涨的DRAM价钱、不踏实的货期和数据在CPU与存储间常常搬运酿成的"内存墙"与"IO墙"瓶颈,正严重制约着AI应用的范围化落地,企业在落地过程中巨额碰到四大痛点:
非结构化数据类型混乱,仅1%数据能被AI有用讹诈并创造价值;
数据失真与模子幻觉为企业带来合规与决策风险;
米兰体育2026世界杯指定中国官网RAG经由激励多副本冗余、数据反复传输,老本居高不下;
面向PB级海量数据时,传统架构性能瓶颈突显,难以范围化落地。
浮松"1%数据困局",让AI走向数据
当下企业被海量非结构化数据包围,PDF、邮件、音视频、演示文稿、财务报表等数据握续增长,但能被大模子调用并产生价值的占比不及1%。
RAG时刻通过数据向量化、优化批量刷新周期、依托GPU集群兑现散布式处理,可浮松数据探询限制,让AI掩饰更平淡的数据着手。而IBMStorageScale的中枢突破,在于放置"数据迁徙至AI"的传统模式,兑现"AI走向数据"的全新范式。粗浅的说,便是CAS时刻径直在存储层作念文档的提真金不怕火和向量化(致使集成了NVIDIA的微职业)兑现了让AI走向数据,即让AI快速定位合规、洁净的可用数据,从起源责问模子幻觉风险,这一才调依托IBMCAS本色感知存储(Content-AwareStorage)时刻兑现。
AI存储新范式:CAS将向量处理下千里至存储层
CAS的颠覆性篡改,是让存储系统从被迫"数据仓库"振荡为主动"AI参与单位"——存储不再仅保存数据,而是对数据项进行量化雄厚,将正本由向量数据库承担的文档向量化经由,从应用层径直下千里至存储层。

IBMCAS
平淡来讲,传统RAG需先将数据从存储取出,在外部完成向量化后导入向量数据库;而CAS可在存储系统里面完周详经由处理,数据无需迁徙、无需拷贝。
该时刻源于IBM策动院在当然言语处理、向量镶嵌模子、硬件加快领域的始终时刻积聚。文档数据提真金不怕火经由深度整合基于NVIDIANIM构建的NVIDIANeMoRetriever微职业(隶属于NVIDIAAIEnterprise),凤凰彩票确保AI助手与AIAgent基于最新、最联系的落魄文嘱托,简化RAG运维、进步AI应用业务价值。
IBMStorageScale(原GPFS)为企业构建全局和谐数据平台,在多站点、多云、数据中心与边际环境间打造单一定名空间,兼容第三方存储,浮松数据孤岛,兑现全域数据和谐探询。CAS手脚StorageScale的全新AI增强才调,助力企业从现存数据钞票中挖掘更大价值,显贵进步RAG准确性、减少模子幻觉,让AI模子无需再行历练即可同步最新数据,适配科研、客户职业、学问型应用等企业级场景。
企业级RAG范围化:浮松性能瓶颈,加码安全合规
市面主流向量数据库撑握百亿级向量,常常需要数十乃至上百台职业器,节点范围膨大后,散布式索引同步、故障收复、扩容迁徙等问题频发,运维与老本压力雄壮。

IBMStorageScaleSystem
IBMStorageScale存储有缠绵兑现单职业器承载1000亿向量,按企业典型文档场景测算,可全面掩饰PB级至数十PB级非结构化数据,为企业CIO带来四大中枢价值:
基础步调老本指数级着落:无需部署数十乃至上百台向量数据库职业器;
运维复杂度大幅责问:单一存储集群即可撑握全经由RAG需求;
企业级及时性保险:端到端延伸低至694毫秒,知足中枢业求及时条目;
数据安全才调强化:摄取原始数据源权限管控体系,聊天机器东说念主嘱托等繁衍数据和谐投诚安全政策。
底层中枢上风:数据当场处理、无需迁徙,检索与计算在数据存储位置径直完成,自然契合数据合规与安全管控条目。
单职业器承载千亿向量的时刻底气:中枢依托IBMStorageScaleSystem6000全闪存存储一体机:单节点成立48块NVMe盘,搭载PCIeGen5与400GbInfiniBand高速互联,聚拢NVIDIAGPUDirectStorage时刻,兑现GPU径直探询SSD数据,跳过CPU数据搬运智商。
系统将超大范围索引拆分为多个孤独子索引,各子索引可孤独优化、孤独重建、互不侵扰,澈底责罚传统向量数据库"牵一发而动全身"的重构痛点。
实测数据对比:纯CPU环境下,千亿级向量索引重建需120天;搭载6块NVIDIAH200GPU的IBMStorageScaleSystem6000,仅需4天即可完成。
结语
东说念主工智能时期,存储的脚色被再行界说。IBM给出明确谜底:存储不应成为AI瓶颈,而应是AI基础步调的中枢加快器。
本次有缠绵提供纯软件版与一体机版两种录用形状,全面兼容RHELAI开源数据活水线,深度集成NVIDIAAIDataPlatform,是可径直落地坐褥环境的企业级责罚有缠绵。
以IBMStorageScale为中枢的AI存储有缠绵,正在让PB级企业RAG从时刻构念念变为试验。RAG的范围上限,不再受限于向量数目与存储性能,而取决于企业可触达、可讹诈的数据领域。
[1]IBMIntroducesContent-Aware-StorageforRAGWorkloads,Storagereview,April22,2026.

IBMCorporationlogo.凤凰彩首页

备案号: