开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口-开yun体育网一朝剧情发展不如东谈主意-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口
你的位置:开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口 > 新闻资讯 > 开yun体育网一朝剧情发展不如东谈主意-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口
开yun体育网一朝剧情发展不如东谈主意-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口
发布日期:2026-04-02 07:10    点击次数:99

开yun体育网一朝剧情发展不如东谈主意-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口

“2026年存储相干规模的投资限制将远超其他通盘芯片类型,实在影响AI改日竞争神色的居品模样是存储。其中市集需求增长最快的是企业级存储,在AI带动下的存力发展最径直的体现就在eSSD的容量上。”在3月27日举办的CFMS|MemoryS 2026上,长江存储科技有限牵累公司固态硬盘行状部发达东谈主谭弘示意。他代表长江存储共享了AI与企业级存储的改日,以及如何使用eSSD时间终了有算协同,坑害AI期间的存力瓶颈。

AI期间,存力不是“油桶”而是“真金不怕火油修复”

存力在不同历史时期饰演着不同脚色。在PC期间,存力主要担当外存修复脚色,主要居品模样是软盘、光盘;进中计罗期间,开动出现数据中心见识的存力,成为信息基础关节;进入到转移互联网期间,用户及时交互条款越来越高,短视频、直播等促进了闪存的发展,替代了一部分HDD成为主流。“当今咱们进入到AI期间,GPU引颈存储架构的升级,以QLC、HBM、高带宽闪存为代表的新时间新址品模样不时表现。跟着AI在云和端的握续浸透,存力将实在成为GPU期间决定坐褥后果的‘真金不怕火油修复’,而不是‘油桶’。”谭弘示意。

业界有不雅点以为AI竞赛正在进入下半场,谭弘示意,AI的上半场主要集会在考试,重在“厚积”,“这好比修王人内功,通过海量的数据来为系统筑基”,而实在要让AI表现作用,环节在于推理侧,“AI的推理犹如(技击中的)招式,在多种万般化的应用场景中,拳、掌、腿等不同招式各适其用,经由考试不同的模子和数据,将适配于万般推理场景,为最终用户开释最大的价值。”谭弘示意,推理侧重在“薄发”,磨真金不怕火的是天真欺诈,“一招制敌(处理问题)”。

存储带宽瓶颈已严重放浪算力灵验利用

跟着天下各大考试模子的锻练,推理需求迎来全面爆发,算力和存力进行系统层面的深刻整合将会是改日一个要紧的发展趋势。“然则在这一整合实验中,由于存储墙的存在,AI在考试和推理中时刻濒临着存储带宽的瓶颈。骨子上,面前的算力增长已进取了存储带宽所带来的支握礼貌,这就意味着海量的模子参数和险峻文需要通过一个相对狭小的漏斗口,即存储的带宽,进行传输,导致算力无法充分开释。”谭弘示意。

谭弘征引IEEE一篇著述中建议的论点说,面前AI立异的环节,已不单是在于筹办力,“实在放浪咱们大限制言语模子的瓶颈不是数学——而是存储”,并从考试和推理两个不同阶段张开诠释。

“从考试阶段来看,跟着模子变大,故障发生隔断也从之前的小时级别责问到分钟级别,导致考试失败频次加重,形成GPU的恭候。”谭弘示意,“面前限制算力集群可费用大要在50%傍边。”

“这时Checkpoint机制的重要性就体现出来。这就像打咱们打一个3A游戏,好多3A游戏不啻有一种结局。一朝剧情发展不如东谈主意,咱们不错随时退回到往日某一个归档,从而经由不时的尝试,最终达到咱们的指标。Checkpoint不错使咱们提高考试鼓吹的后果,毋庸每次都回到肇始点重来,约略权臣检朴咱们的考试资本。”他说。

从推理阶段看,一大痛点则是模子参数目的急剧上涨。“当下,主流模子的参数目限制都在以指数级进取增长,而GPU所配的存储容量的增长是线性的,两者的差距会越来越大。为了终了更长的险峻文推理,集合的缅念念/真贵幻觉,责问每Token的资本,GPU需要把KV Cache下放到eSSD,这需要更大容量、更高性能的eSSD,以支握海量Token的迷糊。”

转头而言,谭弘以为,在系统层面,存储带宽放浪了算力的灵验利用,存储和不同GPU之间仍然存在壁垒。

eSSD可灵验坑害AI考试和推理瓶颈

尽管存储业界在握续栽植带宽智商,如从SSD到更快的DDR再到HBM,带宽正在不时地拓宽。但此外还有若何的处理办法和宗旨,来坑害AI考试和推理的瓶颈呢?

“在考试阶段不错使用大容量的单盘的QLC eSSD来存放Checkpoint,可权臣栽植GPU的利用率,减少恭候时分,责问考试资本。”谭弘示意,QLC eSSD限制部署已趋于锻练,在特定场景下的写入性能和写入持久性依然相配接近TLC eSSD。

从推理场景看,谭弘示意,AI推理依然激勉了存储的进一步分层,业界依然推出了Token的缓存层和性能的缓冲层。率先把KV Cache下放到eSSD算作一个缓冲。其次在性能缓冲层上,终了在多用户、多模子切换场景下对数据进行预读等,从而栽植I/O的速率,减少恭候。“至此,企业级的eSSD依然承担起险峻文现象的不休、查阅学问的责任,eSSD将不仅是数据仓库,也将成为存算协同的数据引擎。”他说。

eSSD又如何通过握续的时间创新坑害存储瓶颈,开释算力潜能?谭弘示意,在长文本推理和KV Cache方面,需要极高的读取性能,eSSD的接口不时升级,用更低蔓延的限度器以减少CPU、GPU的恭候。据了解,目下PCIe 5.0依然全面商用,PCIe 6.0展望2027-2028年进入企业级市集,PCIe 7.0居品的研发也依然在路上。此外,RAG学问库模子的加载与伏击换需要eSSD同期具备超大容量和更高的性能,与XPU直连,在eSSD和XPU之间径直传输数据,提高后果。“启动和多模态推理时,需要愈加褂讪的峰值读取性能,对eSSD来讲,在接口、性能、容量、生态协同、品性等方面的条款在不时的栽植。”他说。

终末,谭弘示意,长江存储算作国内一家3D NAND研发和制造的半导体企业,经由多年的发展,依然从存储颗粒晶圆供应商成长为一家全面提供存储决策的制造公司,有智商提供全场景的存储处理决策。在居品和时间方面,长存将握续加大干预的力度,聚焦企业级存储中枢的需求,通过创新和工艺优化,不时栽植居品在可靠性、容量及性能上的表现;在供应链方面,则将长久与配结伙伴配合,提供愈加褂讪、可握续的供应链支握。

作家丨连晓东

剪辑丨张心怡

好意思编丨马利亚

监制丨赵晨开yun体育网



相关资讯