

2026年6月5日,在北京召开的在英特尔至强 6+ 新品发布会暨数据中心改动日上,英特尔给出了其对AI时期下一个关节转机点的判断:当AI从大模子考验全面转向Agentic AI(智能体AI)的规模化落地,数据中心对算力的诉求正在加快记忆CPU。这并非对GPU迫切性的辩说,而是对AI基础措施架构的一次系统性重构。
英特尔商场营销集团副总裁兼中国区总司理郭威在会上指出,以算力、数据、算法和收罗为核心的AI基础措施形状正在重塑。跟着AI向云、边、端更平庸地部署,羼杂式AI成为主流,CPU动作核心的作用日益突显。“面向Agentic时期,通过CPU、GPU、存储与收罗的高效协同,构建系统级智商,才气真实开释AI规模化应用的价值。”

这一判断的背后,是一组关节数据:2025年,中国AI推理数据量初次超越考验数据量;预测2026至2027年,企业场景中的活跃智能体数目将同比增长超200%。当AI的责任负载从“真金不怕火大模子”转向“用智能体”,一场围绕“算力、存力、连辛苦于、保险力”的新式智算中心底座之争已然打响。
从1:8到1:1,智能体时期CPU重回C位
在曩昔的大模子考验时期,一台GPU处事器相通搭配两颗CPU,酿成典型的1:8配比。CPU在很猛过程上上演着“副角”,风雅数据预处理和任务诊治。意料词,当海量智能体开动运行,任务模子发生了根人性改动。

“曩昔几个月咱们不雅察到,无论你养了若干个智能体,每个都会耗尽CPU;当你要让它去调用数据库、践诺一段剧本,这又会占用异常的CPU算力。”英特尔数据中心集团副总裁兼中国区总司理陈葆立在会后的媒体群访中夸耀,国内某当先大模子厂商从旧年到本年,其CPU需求已提高了5倍。“这是真实的反馈”,他基于此判断,CPU与GPU的比例正从1:8缓缓向1:1致使更高演进,最根柢的逻辑在于:“当你要给AI更多任务的期间,绝大多数任务的践诺者是CPU。”

这一不雅点取得了产业链伙伴的印证。腾讯云规画家具运营总监周驰从业务体量的角度指出,不应仅从单台处事器的比例去看待这一变化。他描绘了一个权贵的“破圈”风光——当腾讯初次在线下推论其智能体应用时,前来体验的东谈主群中成立者仅占少数,更多的是讼师、白领、工东谈主、农民,年纪跨度致使是从七八十岁的老东谈主到十岁的小一又友。“他们都能讲出来我想用智能体干什么,这个破圈风光相配浓烈。”
这种破圈意味着,巨额曩昔因ROI别离算而未被成立的琐碎、个性化需求正在被AI自动化。这些高并发、需求各样但单点算力条目不高的责任负载,并不需要立志的GPU,而是突出渴求高密度、高性价比、擅长诊治与捏续处理的CPU。 周驰判断,从全球CPU装机量来看,这将带来高大的增量。
动作基础措施提供商,云尖信息副总裁张欢军则从处事器架构角度不雅察到,token(词元)爆发式增长带来的数据进口、诊治、路由乃至token化处理,简直一皆在CPU集群上完成。“曩昔几年GPU发展快,是因为各人都聚焦在大模子。跟着Agentic AI的出现,这种主动的、筹算驱动的AI,让业务负载主要转动到了CPU上。”他设计,改日企业级Agent巨额涌现后,CPU的比重会越来越大。
至强6+:“四力”皆发,用系统想维破解智算痛点
恰是捕捉到这一趋势,英特尔推出了全新的至强6+处理器。动作首款基于Intel 18A制程的数据中心CPU,它并非一次浅显的家具迭代,而是围绕Agentic AI时期智算中心的痛点,从四个维度进行了系统性升级。

在算力层面,至强 6+ 处理器领有最高 288 能效核心,使其能在单个液冷机架(32U空间)内提供36864个核心,以极高密度承载多智能体的并发运行。其内置的AMX(高档矩阵延长)技能,可摊派AI数据预处理并为向量数据库提供加快。不错为客户提供更高并发、更低时延、更优能效的云表算力处事,撑捏 AI 时期各样化的责任负载需求。

在存力层面,全新的至强 6+ 处理器不仅领有576MB 三级缓存,还支捏 12 通谈 DDR5 内存、96 通谈 PCIe Gen 5。搭配英特尔 QAT,可解放 CPU 处明智商,加快压缩、重删、传输等存储责任负载。
陈葆立指出了一个行业痛点:当下大模子的高下文窗口已动辄百万Token,改日可能达到几百万,由此产生的KV Cache(键值缓存)会赶快占满立志的显存。行业趋势是将这些数据卸载到内存或SSD中,平直导致高端SSD“奇货可居”。
“至强 6+ 处理器还有两个迫切的技能,是科罚这个痛点的两把‘金钥匙’。”英特尔中国区技能部总司理高宇强调,QAT(英特尔快速赞成技能)和IAA(英特尔存内分析加快器) 恰是为此而生。QAT能在KV Cache存盘前进行硬件级压缩,压缩比至少达50%,平直从简一半的存储本钱。IAA则能对内存数据进行及时压缩息争压,在不影响加载速率的前提下,大幅从简宝贵的内存资源。高宇暗示:“以前各人以为改软件来用这些功能很艰辛,但今天它们能省下几千、几万块,各人都抢着用。契机是留给有准备的东谈主的。”
在连辛苦于层面,至强 6+ 处理器提供从 200GbE 到 800GbE 的捏续迭代。最新推出的英特尔以太网 E835 截至器支捏从 10GbE 到 200GbE 糊涂量的纯真延长,通过提高每核带宽,在高密度捏造化环境中充分开释高核心数 CPU 平台的性能。
在保险力层面,至强 6+ 处理器通过 6 大类 52 项 RAS 功能(可靠性、可用性、可处事性),运用英特尔 TDX 构建端到端的奥妙规画环境,为 AI 处事器和集群的高可靠、高可用和高可贵重提供硬核看守。
单个处理器支捏“1000个智能体部署”
在发布会现场,“单颗至强6+处理器支捏上千智能体”的说法则东谈主印象潜入。这一极限智商在随后的群访中取得了更紧密的解构,葡萄新京它揭示了英特尔面向智能体时期极致的弹性。

英特尔数据中心集团副总裁兼中国区总司理陈葆立将智能体譬如为“数字职工”,智商有陡立之分,因此硬件设置也需因地制宜。支捏上千智能体的案例,是通过至强6+的单核架构优化,将一颗物理核心的算力资源精细切分,同期“分身”运行3到4个智能体。但他坦言,这种模式更符合处理商场调研、查询信息等相对浅显的平淡责任,单个智能体的齐备性能会有所采取。这在刻下巨额探索性、致使免费的处事阶段尤为适用,不详最大化固定钞票的运用效力,承载海量用户。而跟着改日高价值付费处事的出现,单个智能体将需要更强的智商保险,资源配比当然会走向新的均衡。

这种技能上的“弹性”,不仅体当今核心资源的切分上,更调治于处理器改日的宏不雅设计。濒临是发展“大核”照旧“小核”的行业争论,陈葆立给出了明确的回答:两者都需要,并证实超线程技能将记忆。其根柢主义是为了给客户提供遴荐的解放度。要是业务需要海量并发线程,不错开启超线程让捏造核数翻倍;要是追求极致的单核性能来处理数据库调用等重型任务,则不错关闭该功能。“咱们会捏续把家具迭代的弹性作念进去,以撑捏改日各样不同的变化。”
这种纯真应变的底层智商,恰是为了邻接云尖信息副总裁张欢军所不雅察到的产业需求:在GPU机头侧需要处理复杂诊治的“大核”,而在承载海量轻量级智能体实质运行时,则需要高能效的“能效核”。英特尔同期领有并能无缝兼容这两种架构,使得基础措施厂商不详针对不同行务场景纯真定制。
那么,这是否意味着,改日客户可能只需要平直提倡关于智能体需求,阐扬我方需要什么样的智能体智商即可,而不是像当今这么,要提具体需要多大的内存、需要什么设置的CPU。然后云处事商通过提供智能体的这种处事智商,来酿成一种全新的买卖模式?
关于芯智讯提倡的这个问题,腾讯云规画家具运营总监周驰恢复谈:“我以为这照旧不是改日了。 ” 他夸耀,腾讯云已推出to B的“ClawPro”平台,为企业搭建好一整套包含用户络续、安全审计等智商的智能体平台。职工只需一键认领一个智能体,无需温柔其背后是若干核、多大内存的处事器。而在to C领域,“LightVela”则将这一理念贯彻得更为透顶,完全屏蔽了技能见解,让非技能布景的用户嗅觉仅仅在“养一只可帮我方打工的虾”,需要更强智商时再进行“升格”。这种将智能体动作一种处事平直托付的模式,正在恍惚传统IaaS、PaaS的界限,它不再售卖算力资源,而是平直托付坐蓐力。
这恰是Agentic AI时期最迷东谈主的变革,当基础措施具备了高度的弹性,当底层芯片的复杂性被巧妙地封装和诊治,最终用户所触遭遇的,将不再是冰冷的处事器和晦涩的参数,而是一个个活生生的、即取即用的“数字职工”。英特尔与它的生态伙伴们,正在为这幅图景铺设最底层的基石。
生态共振:加快落地
技能智商的开释,最终需要落地于场景。在这次发布会上,多家国内空间领军企业展示了基于英特尔至强6+的融合效果,勾画出Agentic AI落地的真实图景。
腾讯云基于全栈自研的星星海处事器,行将推出搭载至强6+的新一代云实例。周驰夸耀,从上一代能效核开动,腾讯云即是其AP平台的全球独占伙伴,早期的融合已平庸应用于微信、腾讯告白、腾讯会议等业务。新一代实例将开释288核的并发上风,偶合匹配智能体场景“对单个处理条目不高,但需求量高大”的性情。
针对KV Cache带来的存储焦灼,新华三展示的UniStor X20000 AI数据存储平台,借助至强的高性能存力进行I/O数据流优化,以提高推理效力。阿里云则带来了QAT的执行,其在加解密、压缩/解压缩场景下性能提高超4倍,杀青了物理空间、系统辖宽和能效的全面优化。而火山引擎发布的AICC奥妙规画平台,则运用英特尔TDX技能,为多田户环境下的AI大模子应用构建了真实践诺环境。
“咱们记忆到底层的技能和架构设计,英特尔在连气儿迭代和架构一致性上相配出色。”云尖信息副总裁张欢军指出,关于硬件厂商而言,无需再行设计硬件、即插即用的兼容性,是快速反馈商场需求的关节。
小结:
从大模子到智能体,AI的竞争焦点正从单一的峰值算力,转向由系统级智商撑捏的规模化、普惠化应用。在这场变革中,以英特尔至强为代表的x86 CPU,不仅是PC与处事器时期的始创者,更是新的智能体时期的智算基础措施的关节底座。
尽管远景光明,但悉数参与者都泄漏地意志到,Agentic AI时期的大幕刚刚拉开。当被问及芯片缺货问题时,陈葆立坦言,从旧年年底开动感受到了相配建壮的需求葡萄新京最新(中国)官方网站,垂危态势短期内可见。他的底气在于,英特尔是独一领有我方产能的CPU/GPU芯片公司,不详为供应提供保险。但他也严慎地暗示:“这个需求能否捏续隆盛,最终取决于AI是否真实提高了坐蓐力。当今还处在相配相配早期的阶段。”