你的位置:开云2026世界杯中国官网 > 开云新闻 > 开云世界杯中国有限公司官网 中金 | CPU:推理时期地位重塑
发布日期:2026-05-22 02:56 点击次数:188

炒股就看金麒麟分析师研报,巨擘,专科,实时,全面,助您挖掘后劲主题契机!
中金点睛
Agentic AI的快速发展,带来了对CPU在推理时期地位重塑的探讨,本文通过对CPU需求的原因分析、市集测算及竞争景观探讨,探究CPU的翌日空间。天然短期并弗成完全详情配比,但长久CPU地位的飞腾具备一定合感性。
选录
CPU需求为什么会增长?在大模子考研阶段,以GPU为中枢的矩阵谋划才气是决定模子才气的中枢,产业内关爱焦点也聚焦在FLOPs等GPU的谋划性能优化上。但从2H25起,出现了两方面变化:1)在考研侧,强化学习的重要性升迁,使得CPU/GPU配比成为了系统的要害目的之一;2)在推理侧主要有三个领域:a) 推理Host CPU,配合GPU进行任务更动和应用率优化等,以致实行简便推理任务,形成对GPU的替代作用;b)编排节点CPU,在复杂agentic任务中,当作孤独节点承担逻辑运算并进行任务编排;c) 沙盒实行层随并发任务数加多带来CPU需求。
AI驱动下,CPU市集范畴有多大?咱们从两个维度尝试进行测算:1)中性基于GPU:CPU=1:1配比估量下,咱们测算至2030年大众CPU市集范畴将超1300亿好意思元;2)咱们测算Agentic AI面前情景下(5亿DAU或300亿日均token)对CPU的新增需求约莫为840万颗。从时候发展趋势看,当作新操作系统的“更动器”CPU的升级趋势包括更强的单核性能、更大的内存带宽、更强的I/O才气、更多中枢数。长久来看,咱们瞻望数据中心CPU迭代将围绕三条干线伸开:数据带宽才气升迁、任务单干专科化,以及与加快器的深度交融。此外,在需求快速增长情况下,咱们以为2026年管事器CPU加价趋势有望延续。
竞争景观:x86 vs Arm,谁将胜出?现在大众管事器CPU市集中Arm市占率不到20%,仍以x86架构为主。谈判Agent类居品领有高并发、延续运行、广泛轻量级推理肯求的特色,Arm精简指示集的功耗着力占优,不错解救更多中枢处理并发肯求,适用于高微辞的推理管事,咱们瞻望翌日其份额或将升迁。
风险
CPU需求不足预期,市集竞争加重,上游产能供应垂死。
Text
正文
跟着推理需求的延续升迁,对管事器系统从蓝本以GPU(矩阵谋划)为中枢转向CPU(任务编排等)重要性升迁的参谋渐渐升温,咱们以为长久来看,管事器里面的异构系统会成为趋势。本文重心参谋四个问题:1)从需求角度来看,本轮CPU需求升迁的原因是什么?2)类比存储的变化,面前CPU市集在供给和需求端呈现什么情状?3)长久视角看,翌日CPU的发展趋势有哪些?4)CPU市集的竞争景观怎样?
CPU需求为什么会增长?
在大模子的考研阶段,以GPU为中枢的矩阵谋划才气是决定模子才气的中枢,产业内关爱焦点也聚焦在FLOPs等GPU的谋划性能优化上。但从2H25起,出现了两方面变化:1)在考研侧,强化学习的重要性升迁,使得CPU/GPU配比成为了系统的要害目的之一;2)在推理侧主要有三个领域:a) 推理Host CPU,配合GPU进行任务更动和应用率优化等,以致实行简便推理任务,形成对GPU的替代作用;b)编排节点CPU,在复杂agentic任务中,当作孤独节点承担逻辑运算并进行任务编排;c) 沙盒实行层随并发任务数加多带来的CPU需求。
考研视角:强化学习带来对CPU需求的升迁
强化学习对CPU/GPU配比提议新要求。与传统好奇上以为在考研阶段GPU是独一重要的揣度目的不同,跟着强化学习的重要性升迁,谈判CPU资源的抑遏也成为了一个值得关爱的标的。现在强化学习的试验中,环境交互以及怎样分拨硬件资源,还是成为了系统的主要瓶颈,由于需要广泛CPU资源去运行模拟环境,CPU不足也会形成GPU 空转。因此合理设想CPU/GPU的配比,让CPU的线程数等于大概大于GPU SM 的数目,也成为了一个重要标的。但从完竣量的角度看,咱们判断强化学习带来的对CPU的需求相对推理较为有限。
OD体育(ODSports)官网入口推理视角:Agentic AI时期,CPU成为瓶颈要津
简便推理:成本视角下,CPU对GPU的替代作用
成本视角考量,CPU对GPU存在一定替代可能。面前GPU仍处于紧缺情状,同期高性能的GPU岂论是租出价钱如故缺货情况王人未见到彰着缓解。在考研场景中很难接管其他谋划芯片对GPU进行替代,但来到推理场景后,一方面对矩阵谋划的性能要求有所下落,另一方面在一些简便的推理任务中,如chatbot等,业内还是运转接管浮点谋划性能较低的RTX系列等算力芯片进行推理。
谈判CPU价钱对比GPU的上风彰着,咱们判断在一些简便的推理任务中,CPU一定程度上也可能替代GPU,带来一定拉动。从海表里头部CSP对ASIC芯片的鼓舞,以及对定制化CPU芯片的探索念念路看,也具有一定的共同之处。但这部分无法进行具体的测算,同期潜在空间有限。
图表1:CPU在推理中的重要性升迁
贵寓起首:The Rising CPU:GPU Ratio in AI Infrastructure: Drivers, Trends, and Implications(Intel,2026年),中金公司研究部
Agentic AI:Token耗尽占比延续升迁,复杂任务编排使CPU成为新的瓶颈
咱们以为Agentic AI时期CPU的变化具有三个特色:1)总体来看:任务链条和经过复杂带来的CPU重要性飞腾;2)使命负载复杂化:不同的使命负载对CPU要求不同,RAG、ChemCrow等使命负载中,CPU 还是成为了中枢瓶颈;3)并发数目加多:并发数目加多会进一步加大CPU当作瓶颈的抑遏情况,进而在实行层带来对沙箱的需求增长。
Agentic AI具有更泛化的应用才气,正渐渐成为AI应用的主流。Agentic AI以生成模子为基础,加多了编排、缅想和目的导向行为,不错缱绻多要领任务、调用器具、迭代驱散,并在更永劫刻的使命经过中运行。凭据OpenRouter数据,到2025年底,推理产生的token已越过总token的50%,有15%的推理过程以“外部器具调用”扫尾。
图表2:推理产生的token数占比
贵寓起首:OpenRouter,中金公司研究部
图表3:以“外部器具调用”扫尾的推理过程占比
贵寓起首:OpenRouter,中金公司研究部
多要领、多器具调用的Agentic AI带来任务经过的复杂化。从使命流视角看,在传统的生成式 AI(如单轮对话的大说话模子)中,全体的输入-输出经过相对简便,要领也较少。但跟着AI向Agentic(智能体化)演进,在推理过程中要领愈加庞大、不同器具、外部API 调用等成为常态,因此CPU当作任务编排的中枢重要性在飞腾。
图表4:Agentic AI在编译器,任求实行经过,实行复杂度方面的变化
贵寓起首:A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI(Georgia Institute of Technology,Intel,2025年),中金公司研究部
Agentic AI 任务中器具处理需求的出现,在部分的使命负载场景下CPU还是成为新的瓶颈要津。在大说话模子的实行面貌下,推理经过为:推理1——器具调用1——推理2——器具调用 2——推理 3……,由于系统必须比及LLM 生成完满器具调用的通盘 token,才运转实行,因此会带来GPU 空转(恭候器具复返驱散)和器具空转(恭候模子生成指示),因此需要CPU进行器具处理。从而使系统从原来的GPU为中枢以外,CPU当作器具处理的重要性大幅升迁。《A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI》的论文中列举了不同的使命负载延长发扬,不错看出由于CPU上的器具处理可能占据端到端延长的很大一部分,因此行业内优化的重心来到了以CPU 为中枢的优化战术上。
图表5:在莫得部分器具调用的情况下,会形成GPU空转带来延长
贵寓起首:Conveyor: Efficient tool-aware llm serving with tool partial execution(Duke University,2024年),中金公司研究部
图表6:不同使命负载下端到端运行的延长情况,CPU 还是成为了中枢瓶颈
贵寓起首:A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI(Georgia Institute of Technology,Intel,2025年),中金公司研究部
动态视角看,CPU 的逾额订阅会跟着并发任务的数目加多变得愈加严重。跟着 批处理(Batch size)大小的加多,以及输入/输出 token长度的加多,在不同的使命负载下,CPU 当作瓶颈要津的影响是在渐渐变大的。也便是说,用户数大概并发任务的加多,会使得CPU 中枢数目的要求更高。举例当Batch-size达到 128 的时候,系统需要同期更动数百个器具实行程度,因此CPU 的中枢数成为了新的短板。而加多CPU资源在延长改善和提高系统应用着力方面具有彰着成果。
图表7:加多CPU资源的分拨不错收缩延长
贵寓起首:Characterizing CPU-Induced Slowdowns in Multi-GPU LLM Inference(Georgia Institute of Technology,2026年),中金公司研究部
图表8:分拨更多的CPU中枢不错镌汰高应用率时刻
贵寓起首:Characterizing CPU-Induced Slowdowns in Multi-GPU LLM Inference(Georgia Institute of Technology,2026年),中金公司研究部
Sandbox实行层:驱动多核并发与硬件凭空化需求的增长
复杂Agent任务带来沙箱(Sandbox)需求快速增长。在企业级应用场景中,为确保系统安全性与实行环境的白净,系统会针对每一个外部器具调用肯求,瞬时拉起(Spin-up)并随后断送(Tear-down)一个孤独的微型凭空机或容器(MicroVM/Container),即沙箱[1]。从面前的任务分类看,除了少数的只读型、纯API 调用、纯腹地调试等任务以外,波及到自主实行代码或调用外部器具的任务,沙箱在系统安全、着力限度、环境一致性等方面的上风标明它王人是必须存在的。
图表9:多智能体架构中,实行智能体应用凭空机(VM)当作沙箱来运行代码
贵寓起首:The Rising CPU:GPU Ratio in AI Infrastructure: Drivers, Trends, and Implications(Intel,2026年),中金公司研究部
沙箱耗尽 CPU的硬件凭空化指示集(如 Intel VT-x/AMD-V)性能,更对 CPU 的物理中枢数提议了线性增长的需求。当系统面对同期实行数十个网页合手取、代码编译或数据清洗等并发任务时,雄壮的物理中枢数是已毕横向扩展、申斥任务间高下文切换损耗的独一解,开云世界杯中国有限公司官网因此对CPU更动才气产生更高要求。而CPU的核数决定了能开启几许个沙箱(即并行环境)。
图表10:Agentic AI对沙箱的需求
贵寓起首:微软,中金公司研究部
AI驱动下,CPU市集范畴有多大?
从上文不错看出,考研和简便推理对CPU的需求处于次要隘位,中枢如故agentic AI。跟着 agentic AI的快速发展,及多要领的复杂推理任务比重和难度加多,对任务编排更动的要求也延续提高,进而激勉了对CPU需求的加多及翌日GPU:CPU配比变化的探讨,本章节从两个维度尝试进行测算。
配比视角:Agentic AI鼓舞管事器CPU市集范畴快速增长
咱们瞻望2030年大众CPU市集范畴将浮松1300亿好意思元
CPU在单台AI管事器中的配比将迎来升迁,升迁系统边缘着力。从第一章对CPU需求的视角开赴不错看出,曩昔AI管事器中CPU在配比的数目、核数等多个方面王人还是无法答应需求,为保持系统全体的高微辞量,管事器架构需要权贵升迁CPU的中枢数和煦存性能,导致CPU在全体算力采购成本中的占比提高。因此咱们瞻望CPU的需求将迎来增长。
配比的具体数字是中枢。聚焦几家CPU 厂商最新表述来看:1)英特尔:CEO陈立武在1Q26事迹会上提到CPU:GPU配比有望从1:8/1:4进一步升迁;2)AMD:1Q26事迹会上苏姿丰瞻望大众管事器CPU市集有望在2030年达1200亿好意思元范畴;3)ARM:4Q26事迹会上CEO瞻望大众管事器CPU市集有望在2030年超1000亿好意思元范畴。
需要指出的是,面前对GPU:CPU的配比并莫得一致论断。由于现存的管事器架构较为固定,因此在推理管事器中咱们瞻望仍将以2个GPU配1个CPU的面貌进行成立;但谈判到agentic AI的需求,纯CPU的机柜也将运转连续部署,因此从概括的视角看,CPU:GPU配比将从现在8卡管事器中1:4的比例渐渐升迁,2030年或将达1:1以致更多。
中性基于1:1的瞻望倒推,咱们测算至2030年大众CPU市集范畴将超1300亿好意思元。中枢假定有:1)大众算力卡瞻望2030年达4240万颗;2)AI管事器CPU:GPU配比2030年达1:1;3)AI管事器CPU单价随中枢数的加多、性能的升迁及代工的升级2026-2030年增幅在16%。
图表11:数据中心CPU市集范畴测算
注:图中CPU价钱为预估,并不代表实质售价
贵寓起首:BBG,各公司官网,中金公司研究部
需求视角:Agentic AI对CPU数目及核数提议新需求
总量:面前情境下Agentic AI对CPU新增需求越过800万颗
咱们测算Agentic AI面前情景下对CPU的新增需求约莫为840万颗。从需求端对CPU的测算较为复杂,咱们简化后通过并发任务数目的格式,参谋Agentic AI对CPU的拉动作用。测算的中枢念念路为:1)通过日活用户数或日均token耗尽量对并发任务数目进行预估;2)对任务按复杂度进行中枢参数分拨,包括任务占比,占用核数,调用agent数目等;3)分四种情况谋划对应CPU核数需求;4)测算所需CPU数目。
图表12:Agentic AI对CPU稀疏需求测算
贵寓起首:各公司官网,中金公司研究部
结构:CPU应用场景需求进一步细化
从时候发展趋势看,当作新操作系统的“更动器”CPU的升级趋势主要有:1)更强的单核性能来申斥单次推理的延长,2)更大的内存带宽和更强的I/O才气来更动更长的高下文以及解决海量的数据,3)更多中枢数来解救高并发查询及凭空化。
图表13:Agentic AI下数据中心CPU三大应用场景
贵寓起首:各公司官网,中金公司研究部
价钱趋势:短期供需失衡,管事器CPU有望延续加价
由于CPU产能分拨存在一些肮脏性,因此劳作CPU供给侧的较好测算,但从定性视角看,Agentic AI等需求对CPU的拉动还在延续增长,因此CPU市集出现了一定程度缺货加价。
受供需缺口影响,咱们以为2026年管事器CPU加价趋势可延续。限度2026年5月,咱们不雅察到Intel管事器CPU在2月、3月已阅历了两次加价,涨幅在5-15%之间,同期部分型号CPU交期还在延续拉长,侧面体现了对CPU的需求增长。
► 需求侧来看,如前所述,主要受益于AI推理需求增长,同期通用型管事器面对更新换代的需求,咱们瞻望2026年大众管事器出货量有望同比增长近20%,翌日Agentic AI有望拉动AI及配套管事器需求的加快增长。
► 供给侧来看,AMD和Arm均接管台积电先进制程代工,计划GPU、ASIC等算力芯片需求延续上修,台积电2-5nm制程订单需求隆盛,产能彭胀较为有限,咱们瞻望供需缺口将延续至27年。现在来看,AMD CPU27年产能供给仍有一定弹性。凭据陈立武5.19JPM大会发言,英特尔18A良率每月稳步升迁,有望在26年底前已毕老到良率目的。计划来看,咱们瞻望供需缺口将延续至27年,2026年管事器CPU有望迎来进一步加价。
此外,受益于管事器CPU隆盛的需求,管事器CPU配套芯片,如PCIe retimer、PCIe switch以及内存接口芯片等细分赛谈,亦值得关爱。
图表14:Intel产能瞻望
注:绿色为现在主力产能,统计限度1Q26
贵寓起首:Intel官网,中金公司研究部
长久趋势:推理架构正从“GPU从属CPU”转向“CPU强绑定集群”
翌日十年,数据中心CPU的演进旅途不太可能回到单纯追求频率或中枢数彭胀的传统逻辑,而将围绕三条干线伸开:数据带宽才气升迁、任务单干专科化,以及与加快器的深度交融。
► CPU 将进一步向高带宽数据斥地演进。跟着 AI 负载从单次张量谋划扩展至大范畴高下文解决与情状爱护,咱们瞻望内存通谈数目、内存带宽密度和煦存容量的重要性将延续飞腾。LPDDR 在数据中心的接管、SOCAMM 模组的发展,以及更高通谈数 DDR 设想,均指向一个标的:荫藏内存延长、升迁带宽密度、救援大容量高下文成为中枢目的。咱们以为翌日竞争焦点将不再仅是每中枢性能,而是数据 fabric 组织才气与片上集中带宽。
► CPU 将延续分化以匹配不同使命负载,朝三类标的并行发展:1)高单核性能、高内存带宽、与 AI 加快器保持一致性互连的紧耦合型 CPU;2)面向 KV-cache 解决、集中分层与数据旅途处理的 DPU/数据平面型 CPU; 3)高中枢密度、重微辞的云型 CPU。这种分化说明 CPU 并未被 GPU 替代,而是在 AI 体系中承担更专科化的变装。
图表15:NVIDIA BlueField-4将Grace CPU与NIC协同封装
贵寓起首:英伟达官网,SemiAnalysis,中金公司研究部
图表16:英伟达发布Vera CPU机柜
贵寓起首:英伟达官网,中金公司研究部
► CPU 与加快器的畛域可能进一步肮脏。APU架构(如集成 CPU + GPU 的设想)可能减少孤独 head node 的需求;部分 RL 考研负载可能迁徙至具备腹地环境实行才气的专用加快器;同期,内存池化与 CXL 扩展可能申斥传统每机架必配孤独 CPU的绑定比例。从更永恒角度看,CPU 以致可能镶嵌交换芯片或数据中心集中中枢之中,成为数据流更动的基础限度单位。
咱们以为,翌日CPU的价值不在于替代GPU,而在于承载系统复杂性。在 AI 2.0 时期,模子才气的升迁带来更多交互、更长高下文与更多外部调用,CPU 当作通用实行与限度单位,仍将是保管系统可扩展性的基础组件。其形态可能变化,但其在谋划体系中的中枢性位不会脱色。
竞争景观:X86 VS Arm,谁将胜出?
X86 VS Arm:X86 份额源流,Arm有望加快追逐
现在,大众管事器CPU市集中Arm市占率不到20%,仍以x86架构为主。
X86 vs Arm:x86生态老到度仍较为源流,Arm在云表推理份额瞻望将延续增长。Agent类居品领有高并发、延续运行、广泛轻量级推理肯求(比如多轮对话、器具调用、缱绻推理等)的特色,ARM精简指示集的功耗着力占优,不错解救更多中枢处理并发肯求,适用于高微辞的推理serving。
x86在生态老到度上仍然保持源流的上风。广泛推理框架在x86上优化更老到,部分指示集对矩阵运算有挑升的加快,因此咱们以为对于较大模子的运行、羼杂精度谋划或和传统软件栈深度集成的场景下,x86的兼容性和器具链上风彰着。
转头来说,Arm架构的CPU因为高能效比在CSP中得回大范畴部署,为CSP自有业务、有才气为Arm架构进行软件优化的客户提供更具性价比的聘用;x86 CPU的管事器具有更完满的生态和极强的兼容性,对中微型企业意味着开箱即用的通用性与最低的迁徙摩擦,具有庸碌而踏实的需求。咱们瞻望跟着Agentic AI带动AI管事器CPU配比的升迁,以及ARM在CSP厂商及企业级客户的延续浮松,在2030年大众管事器CPU市集中占比有望接近一半。
图表17:x86 vs ARM市集范畴预测及份额
贵寓起首:IDC,中金公司研究部
风险请示
CPU需求不足预期。CPU需求主要来自Agentic AI趋势下各场景的应用。若Agentic AI进展不足预期,或CPU在管事器集群中配比升迁程度不足预期,或各大云厂商本钱开支节拍放缓,CPU的需求增速或不足预期。
市集竞争加重。管事器CPU市集主要分为x86与Arm两大阵营。若x86与Arm架构竞争加重,x86阵营内AMD与Intel竞争加重,Arm阵营内各厂商与云厂商自研CPU竞争加重,或将激勉份额争夺与价钱压力。
上游产能供应垂死。CPU上游供应链波及要津广阔。若先进制程及先进封装产能延续垂死,晶圆供应垂死,内存等要害配套器件供应垂死,薄膜千里积、量测检测等要害斥地供应受限,CPU的产能供应及市集增长或将碰到瓶颈。
[1]一个与宿主机(Host OS)严格隔断的、受限的凭空化谋划环境(时时基于Docker容器或更轻量级的MicroVM,如Firecracker)。当需要运行代码时,它会将代码发送到Sandbox中实行,而不是在系统现存的环境中运行。
Source著作起首
]article_adlist--> Legal Disclaimer法律声明
杰出请示
本公众号不是中国海外金融股份有限公司(下称“中金公司”)研究证明的发布平台。本公众号仅仅转发中金公司已发布研究证明的部分不雅点,订阅者若使用本公众号所载贵寓,有可能会因劳作对完满证明的了解或劳作相关的解读而对贵寓中的要害假定、评级、目的价等内容产生明白上的歧义。订阅者如使用本贵寓,须寻求专科投资参谋人的教会及解读。
本公众号所载信息、想法不组成所述证券或金融器具营业的出价或征价,评级、目的价、估值、盈利预测均分析判断亦不组成对具体证券或金融器具在具体价位、具体时点、具体市集发扬的投资建议。该等信息、想法在职何时候均不组成对任何东谈主的具有针对性的、教会具体投资的操作想法,订阅者应当对本公众号中的信息和想法进行评估,凭据自己情况自主作念出投资有计划并自行承担投资风险。
中金公司对本公众号所载贵寓的准确性、可靠性、时效性及完满性不作任何昭示或默示的保证。对依据大概使用本公众号所载贵寓所形成的任何后果,中金公司及/或其关联东谈主员均不承担任何格式的连累。
本公众号仅面向中金公司中国内地客户,任何不合适前述条目的订阅者,敬请订阅前自行评估接管订阅内容的允洽性。订阅本公众号不组成任何条约或承诺的基础,中金公司不因任何单纯订阅本公众号的行为而将订阅东谈主视为中金公司的客户。
一般声明
本公众号仅是转发中金公司已发布证明的部分不雅点,所载盈利预测、目的价钱、评级、估值等不雅点的赐与是基于一系列的假定和前提条目,订阅者唯有在了解相关证明中的一谈信息基础上,才可能对相关不雅点形成相比全面的订立。如欲了解完满不雅点,应参见中金研究网站(http://research.cicc.com)所载完满证明。
本贵寓较之中金公司负责发布的证明存在延时转发的情况,并有可能因证明发布日之后的情势或其他成分的变更而不再准确或失效。本贵寓所载想法、评估及预测仅为证明出具日的不雅点和判断。该等想法、评估及预测无需见告即可随时更正。证券或金融器具的价钱或价值走势可能受多样成分影响,过往的发扬不应当作日后发扬的预示和担保。在不同期期,中金公司可能会发出与本贵寓所载想法、评估及预测不一致的研究证明。中金公司的销售东谈主员、走动东谈主员以额外他专科东谈主士可能会依据不同假定和圭臬、接管不同的分析挨次而理论或书面发表与本贵寓想法不一致的市集讨论和/或走动不雅点。
在法律许可的情况下,中金公司可能与本贵寓中说起公司正在缔造或争取缔造业务关系或管事关系。因此,订阅者应当谈判到中金公司及/或其相关东谈主员可能存在影响本贵寓不雅点客不雅性的潜在利益冲突。与本贵寓相关的清楚信息请窥探http://research.cicc.com/disclosure_cn,亦可参见近期已发布的对于相关公司的具体研究证明。
本订阅号是由中金公司研究部缔造并爱护的官方订阅号。本订阅号中通盘贵寓的版权均为中金公司通盘,未经籍面许可任何机构和个东谈主不得以任何格式转发、转载、翻版、复制、刊登、发表、修改、仿制或援用本订阅号中的内容。

海量资讯、精确解读,尽在新浪财经APP
连累裁剪:凌辰 开云世界杯中国有限公司官网