2025 年以来,海外 AI 产业景气度持续提升,以谷歌、Meta 等为代表的海外AI 巨头不断上调 AI 相关资本开支指引,AI 驱动云业务增长提速,以谷歌 Gemini为代表的大模型用户量持续增长,同时 Token 消耗数量大幅提升,AI 正循环效应正在逐步凸显。
同时,英伟达、Celestica、维谛、康宁、Arista、博通等海外 AI 产业链核心公司业绩表现亮眼,不少公司陆续上调业绩指引,同时 OpenAI 与英伟达、博通、AMD 等海外芯片巨头扩大合作,海外 AI 产业链生态“虹吸效应”显著,海外 AI 的蓬勃发展有望给光通信、液冷、服务器电源等板块带来长期成长机遇。
(1)谷歌:据谷歌 2025 年第四季度报告,2025Q4 公司实现营收 1138.3 亿美元,同比增长 18.0%,其中,谷歌云业务实现营收 176.6 亿美元,同比增长 47.8%,谷歌云营业利润率提升至 30.1%,同比提升 12.6 个百分点,GCP 核心产品、AI 基础设施和生成式 AI 解决方案营收持续增长,谷歌云2025Q4积压订单达到2400亿美元,环比增长 55%,同比翻倍,云业务在收入、订单、盈利能力方面持续取得显著增长。在谷歌云业务方面,公司下游结构持续优化:
1)获客速度增长至一季度末的两倍;
2)2025 年签署 10 亿美元合同数量超过前三年总和;
3)老客户服务量超出承诺30%以上。
Gemini 用户量持续增长,每分钟通过 API 调用 Token 消耗量超 100 亿,远超上季度 70 亿。服务业务方面,截至 2026 年初,公司季度搜索的使用量创历史新高,推动业务实现双位数增长。AI 相关领域,公司在搜索的 AI 模式和 Gemini 应用中推出个人智能;公司在 Gmail 引入新的 AI 功能并更新了 Veo;公司添加自动浏览等功能,将Chrome 重构为 AI 为先、代理化的浏览器;公司宣布了通用世界模型 Project Genie项目,供用户使用 Genie3 实时创建和探索互动世界。关于旗舰模型 Gemini,2025年单位成本降低了 78%,推出的 3 Pro 是公司迄今采用最快的版本,平均每日 Token消耗量是 2.5 Pro 的三倍。
公司 2025Q4 资本开支为 278.5 亿美元,同比增长 95.1%,大部分投入技术基础设施,其中约 60%为服务器投资,40%为数据中心和网络设备。公司在 AI 领域的投资已经在业务层面有所体现,公司预计进一步加大对 AI 的投资,公司预计 2026 年资本开支为 1750 至 1850 亿美元,投资规模将在全年持续增加。
(2)Meta:据 Meta2025 年第四季度报告,公司 2025Q4 实现营收 598.9 亿美元,公司预计 2026 年第一季度营收区间为 535 亿美元至 565 亿美元,预计 2026 年全年支出将在 1620 亿美元至 1690 亿美元之间,资本开支将在 1150 亿美元至 1350 亿美元之间,高于分析师平均预期的 1106 亿美元。公司继续在人才、基础设施、数据中心和能源方面进行大量投资,以应对快速演进的AI竞赛,并积极进军智能眼镜领域,寻求拓展 AI 变现渠道。
(3)微软:据微软 2025 财年第四季度报告,公司 FY2026Q2 实现营收 812.7亿美元,同比增长 17%,智能云部门(含 Azure) FY2026Q2 收入同比增长 29%至 329亿美元,其中 Azure 收入同比增长 39%。云需求持续强劲,微软将继续加大 AI 资本支出,第二季度资本支出达 375 亿美元(同比增长 66%)创下新高, 2026 年全年指引尚未公布,市场分析师普遍预计其 2026 财年总支出约 1100 亿美元,确保对研发和产品创新的长期投入。
(4)亚马逊:据亚马逊 2025 年第四季度及全年报告,公司 2025 年第四季度实现营收 2134 亿美元,同比增长 14%;净利润为 212 亿美元,同比增长 6%;其中 AWS云服务的销售额为 356 亿美元,同比增长 24%。
亚马逊 2026 年资本开支预计将达到2000 亿美元,远超市场此前 1460 亿美元至 1490 亿美元预期。主要原因为 AWS 业务以及 AI 需求增长、算力容量投资等,并且公司表示 AWS 订单承诺同比增长 40%至 2400 亿美元。公司管理层对 2026 年一季度的经营利润展望显著低于市场预期,指引区间为 165 亿至 215 亿美元,中值为 190 亿美元,市场预期则约为 225 亿美元。公司表示该指引计入了对电商与国际业务的投入,且包含 Amazon Leo 卫星项目约10 亿美元的增量成本。
2、 国内巨头开启 AI 规模投资新周期,国产 AI 蓄势待发
2024 年开始,以字节跳动、阿里巴巴、腾讯微代表的国内 AI 巨头陆续加大 AI投资,阿里和腾讯资本开支同比增速从 2024 年 Q3 开始显著提速。2024 年四季度,字节跳动豆包大模型引爆市场,2025 年春节开始,Deepseek 大模型逐渐引领国产AI 大模型浪潮,以阿里云、腾讯云、火山云、华为云、天翼云、移动云、联通云等为代表的国内云计算平台和以亚马逊 AWS、微软 Azure 为代表的海外云计算平台纷纷接入 Deepseek,国内各大行业陆续接入/适配 Deepseek 大模型,国产 AI 大模型和国产算力发展呈现出势如破竹的态势。
进入到 2025 年,字节跳动持续大幅扩张 AI 大模型和 AI 应用版图,阿里巴巴宣布开启三年 AI 资本开支大投入期和 AI 人才大幅扩招期,Al 推动阿里云收入增速持续提升并创新高,阿里在 2025 年 9 月的云栖大会上对未来三年资本开支进行上调,表示将在 3 年 3800 亿 AI 资本开支计划外追加更多投资,在 2032 年阿里 IDC 能耗较 2022 年提升 10 倍,并提出 ASI 目标,腾讯资本开支从 2024Q4 开始大幅增长并宣布开启大规模人才招聘。
国内 AI 三巨头 AI 军备竞赛持续加剧,或大幅拉动国产AI 算力产业链发展。2026 年 4 月 2 日,火山引擎表示豆包大模型日均 Token 使用量已突破 120 万亿,较三个月前增长一倍,较 2024 年 5 月份首次发布时增长超 1000 倍。
2026 年 4 月 10日,阿里巴巴官微认领了 AI 视频模型 HappyHorse-1.0,计划在 4 月 30 日开放 API访问功能。内部AI组织方面,阿里巴巴2026年3月16日正式成立Alibaba Token Hub(ATH)事业群,该群以“创造 Token、输送 Token、应用 Token”为核心目标,由CEO 吴泳铭直接负责。自成立 ATH 事业群以来,阿里持续在 AI 领域聚合优势力量和资源,模型层面也不断取得突破,以阿里为代表的巨头已进入 AI 全面加速期。据2025 腾讯全球数字生态大会,元宝已成为国内 DAU 排名前三的 AI 原生应用。伴随着国内 AI 巨头大幅发力 AI 训练大模型和 AI 推理大模型,以及 AI Agent的持续演化,我们认为国产 AI 算力链或迎来黄金发展时代。
(1)字节跳动:豆包大模型日均 Token 使用量已突破 120 万亿
字节跳动持续完善 AI 大模型及 AI 终端产品布局。2025 年 6 月 11 日,字节跳动旗下火山引擎举办 Force 原动力大会,会上豆包大模型升级为 1.6 版,推理、数学、指令遵循、Agent 等能力有较大提升,豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型也正式发布。
doubao-seed-1.6 All-in-One 综合模型是国内首个支持 256K上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力,doubao-seed-1.6-thinking 是深度思考方面的强化版本,在代码、数学、逻辑推理等基础能力上进一步提升,doubao-seed-1.6-flash 是 1.6 系列极速版本,延迟极低,TOPT仅需 10ms,模型价格采用统一定价模式,按照输入上下文长度区间定价,从综合成本来看,豆包大模型 1.6 的综合成本比豆包大模型 1.5·深度思考模型、DeepSeek R1的综合成本下降 63%。
Seedance 1.0 pro 支持文字与图片输入,可生成多镜头无缝切换的 1080p 高品质视频,主体运动稳定性与画面自然度较高。在国际知名评测榜单Artificial Analysis 上,Seedance 1.0 pro 在文生视频、图生视频两个任务的表现均排名首位。此外,字节发布多款 Agent 开发和应用工具,助力企业加速 Agent 落地。行业落地方面,全球 Top 10 手机厂商有 9 家和火山引擎深度合作,八成主流车企接入豆包大模型,已服务 70%的系统重要性银行、数十家券商和基金公司,五成 985高校用豆包大模型做教学、科研创新。
2025 年 12 月 1 日,字节跳动发布豆包手机助手技术预览版并发售少量 AI 工程样机,该样机硬件由中兴通讯 Nubia M153 支持,售价 3499 元,采用 6.78 英寸 LTPO屏幕,搭载高通骁龙 8 至尊版移动平台,具备 16GB 内存、512GB 存储。
此外,字节表示暂时没有自研开发手机的计划,正与多家手机厂商洽谈合作,将与生态伙伴共同打造成熟完善的手机智能助手。豆包手机助手基于字节自研大模型豆包,从应用侧过渡到操作系统侧,能通过系统级授权深度整合多模态输入和跨应用工作流,可实现跨应用任务链执行、复杂场景的多步骤自动化、设备级资源调用等。
面向更复杂场景,豆包展示了操作手机Pro模式,它在大模型推理之外调用Agent与工具链,执行效率更高,触发过程中的询问频率也进一步降低。2026 年 4 月 2 日,火山引擎表示豆包大模型日均 Token 使用量已突破 120 万亿,较三个月前增长一倍,较 2024 年 5 月份首次发布时增长超 1000 倍。据晚点 LatePost报道,日前全球仅三家公司日均 Token 消耗量超过 100 万亿:OpenAI、Google 和字节跳动。其中字节跳动 Token 消耗主要来自中国市场,旗下视频生成模型Seedance 2.0 API 尚未在海外正式上线,海外市场仍有较大增长空间。
在模型层面,最新的豆包大模型 2.0 系列在多模态理解、复杂任务执行等核心能力上实现突破,跻身全球第一梯队。在安全层面,火山引擎正式通过信通院“智能助理智能体产品可信能力认证”及“安全防护产品有效性认证”,成为目前国内唯一一家同时获得这两项认证的厂商。
(2)阿里巴巴:成立 ATH 事业群,进入 AI 全面加速期
据阿里巴巴 2025 财年第三季度财报及业绩交流会,未来三年,阿里将围绕 AI战略核心,加大投入三大领域:
1)AI 和云计算的基础设施建设, 未来三年集团在云和 AI 的基础设施投入预计将超越过去十年的总和。
2)AI 基础模型平台以及 AI原生应用。
3)现有业务的 AI 转型升级。
公司宣布未来三年 AI 相关投入将投入至少 3,800 亿元人民币,超过阿里过去十年在云和 AI 基础设施上的投入总和,明确加码基础设施、基础大模型及业务 AI 化三大方向,全力构建技术护城河。2025 年 9 月 18 日,阿里巴巴云栖大会召开,阿里上调资本开支,表示将在 3年 3800 亿 AI 资本开支计划外追加更多投资,在 2032 年阿里 IDC 能耗较 2022 年提升 10 倍,并提出 ASI 目标,强调两大 AI 战略:
1)通义千问坚定开源开放路线,致力于打造“AI 时代的 Android”;
2)构建作为“下一代计算机”的超级 AI 云,为全球提供智能算力网络。Al 推动阿里云收入增速持续提升并创新高,2026 财年第三季度,阿里云FY2026Q3 实现营收 2848.43 亿元,同比增长 2%,若不考虑高鑫零售和银泰的已处置业务的收入,同口径收入同比增长将为 9%,主要由 AI 和消费驱动增长,阿里云收入强劲增长 36%,其中 AI 相关产品收入连续十个季度实现三位数的同比增长;消费侧,千问 app 与阿里消费生态各应用场景加速融合,千问全端的 MAU 已突破 3亿。阿里表示将继续在 AI to B 和 to C 方向齐发力,发挥“大模型+云+芯片”全栈AI 能力,以及与阿里商业生态的全面融合的优势。资本开支方面,阿里 FY2026Q3总资本开支为 289.99 亿元,同比减少 8.74%,其中购置物业和设备的资本开支为253.76 亿元,同比减少 19.10%。
硬件方面,2025 年 9 月 24 日,阿里发布磐久 AI Infra 2.0 128 卡自研超节点 AI 服务器,支持多种 AI 芯片,单柜支持 128 个 AI 计算芯片,其中 GPU 节点和 CPU节点分离,内部集成公司自研 CIPU 2.0 芯片和 EIC/MOC 高性能网卡,新一代高性能网络 HPN 8.0,采用训推一体化架构,存储网络带宽拉升至 800Gbps,GPU 互联网络带宽达到 6.4Tbps,搭配灵骏集群,可支持单集群 10 万卡 GPU 高效互联,助力 AI 训推提效。
模型方面,2026 年 4 月 10 日, 阿里巴巴官微认领了 AI 视频模型 HappyHorse-1.0,计划在 4 月 30 日开放 API 访问功能。HappyHorse 最早由匿名团队提交在第三方 AI 模型测评平台 Artificial Analysis,平台的文生视频模型榜单Video Arena 采用盲测机制,HappyHorse 模型提交后荣登榜首,超越了字节跳动旗下Seedance 2.0 以及快手旗下可灵 3.0 等知名产品。据澎湃新闻报道,HappyHorse 是阿里 ATH 旗下创新事业部研发的模型,ATH 创新事业部已启动一个 AI 时代的全新交互方式探索计划,HappyHorse 是该方向的一部分。
内部 AI 组织方面,阿里巴巴 2026年 3 月 16 日正式成立 Alibaba Token Hub(ATH)事业群,该群以“创造 Token、输送Token、应用 Token”为核心目标,由 CEO 吴泳铭直接负责。ATH 事业群整合了阿里内部 AI 相关的核心资源,包括旗舰大模型“通义千问”研发团队、消费者 AI 应用部门、钉钉办公平台和夸克智能眼镜等硬件产品,CEO 吴泳铭后续发内部信宣布再做调整,包括新设立集团技术委员会,升级通义大模型事业部。其中技术委员会由吴泳铭担任组长,成员包括周靖人、吴泽明、李飞飞;通义实验室升级为通义大模型事业部后由周靖人负责。自成立 ATH 事业群以来,阿里持续在 AI 领域聚合优势力量和资源,模型层面也不断取得突破,以阿里为代表的巨头已进入 AI 全面加速期。
(3)腾讯:混元陆续开源,元宝 DAU 高速增长
据腾讯 2025 年第四季度财报及业绩交流会,金融科技及企业服务实现营收 608亿元,同比增长 8%,在云服务方面,混元 3D 2.5 版本上线腾讯云,服务游戏开发、影视制作、电商营销等领域。公司 2025Q4 研发支出达238 亿元,同比增长 20%,资本开支达196 亿元,同比减少 46%。
2025 年 4 月 16 日,微信上线 AI 助手元宝,用户可以将它添加为好友,即可直接在微信聊天界面与其进行聊天互动。元宝是腾讯元宝 APP 入驻微信的 AI 助手,搭载混元和DeepSeek双模引擎,并无缝衔接微信生态。它目前支持的核心功能包括:一键解析公众号文章、图片和文档(100M 以内),并支持对解读内容做各种智能互动,同时也支持日常陪伴互动等,并对微信场景进行了特别优化,避免直接调用第三方模型,确保用户数据仅在本地处理。
用户通过腾讯元宝,可以免费使用DeepSeek-R1 满血版、DeepSeek-V3、腾讯混元深度思考模型 T1 以及腾讯混元通用模型 Turbo,不仅支持深度思考,也支持快速输出答案。混元大模型持续突破,模型开源丰富体系,元宝 DAU 加速增长。
基础模型方面,2024 年 9 月,腾讯推出基础模型混元 Turbo,采用 MoE 混合专家架构,训练和推理效率翻倍,推理成本减半;2025 年 3 月,发布新一代快思考模型混元 TurboS,吐字速度提升一倍,首字时延降低 44%,同时应用于腾讯元宝等内部产品,3 月 21 日,TurboS 升级为混元-T1 正式版,显著降低了训练和推理成本,腾讯云宝率先接入DeepSeek-R1,同时上线腾讯混元深度思考模型 T1 及 Turbo S,持续提供的 AI 服务,腾讯元宝 2025 年 2 月至 3 月的 DAU(日活)增长超 20 倍。
5 月,公司推出视觉深度推理模型混元 T1-Vision,7 月推出更小体型、更懂小语种、更全面的混元 Large-Vision。此后,公司陆续上线混元图像 2.0、混元 3D 2.5、混元游戏视觉生成等模型;发布并开源混元 3D 世界模型 1.0,开源中小尺寸模型 Hunyuan A13B/0.5B/1.8B/4B/7B、开源混元图像 3.0,持续丰富混元模型体系。据 2025 腾讯全球数字生态大会,元宝已成为国内 DAU 排名前三的 AI 原生应用。截至 2025 年 9 月 16 日,用户每日在元宝的提问量,已达到年初一个月的总量。
3、 运营商积极投入 AI,智算规模持续增长
运营商云计算业务维持增长,智算规模持续增长。三大运营商云计算营收持续增长,持续投入算力资源,自有通用算力资源保持较大规模,智算算力规模实现较快增长。截至 2025 年年末,中国电信拥有 91EFlops 智算算力,自建智算规模达46Eflops,同比增长 30%;中国联通拥有 45EFlops 智算算力;中国移动拥有 92.5EFlops智算算力。国内 5G 网络建设进入平缓期,运营商网络建设方面总投资持续下降,但算力相关业务资本开支占比呈上升趋势,中国移动曾公开表示对推理资源投资不设上限。
(1)2025 年全年,中国移动实现资本开支 1509 亿元,较去年同比下降 8%,略低于 2025 年计划资本开支 1512 亿元。公司表示 2026 年中国移动将继续加大智算网络投资,总资本计划开支 1366 亿元,其中通信网络 792 亿元、算力网络 378 亿元、智能网络 89 亿元,三大网络中算力网络和智能网络投资占比超 37%。
(2)2025 年全年,中国电信实现资本开支 804 亿元,其中算力基础设施投资202 亿元,占比约为 25.1%;网络基础设施投资 407 亿元,占比约 50.6%。预计 2026年资本开支为 730 亿元,其中算力基础设施计划投资 255 亿元,同比增长 26%,占总投资比例约 35%。
(3)2025 年全年,中国联通实现资本开支 542 亿元,预计 2026 年资本开支投资约为 500 亿元,其中算力投资占比 35%。
我们认为运营商积极发展创新业务,有望驱动运营商在算力基础设施方面持续投资,对于 AIGC 方面,运营商以“国家队”身份持续投入到 AI 模型训练中,有望赋能多个垂直领域,加速 AI 应用在多行业持续渗透,国产算力产业链(AI 芯片、AI 服务器及电源、AIDC、液冷风冷、HVDC&柴发、光通信、交换机及路由器、铜缆等)有望持续受益。
4、 OpenClaw 席卷全球,算力租赁掀起涨价潮,AI 势如破竹
国外大模型持续迭代,国内大模型加速追赶,拉动算网基础设施建设。2018 年,谷歌提出基于 Transformer 实现的预训练模型 BERT,同年,OpenAI 公司发布了第一代生成式预训练模型 GPT-1,擅长文本内容生成任务。2022 年 11 月,OpenAI 发布的 ChatGPT,随后发布文生图模型 Sora/Sora2、多模态模型 GPT-5、GPT-4.5、GPT-4o、o3、o4-mini 模型。
国内大模型加速追赶,截至 2025 年 7 月 27 日,据新华社消息,国内已经发布了华为“盘古”、百度“文心一言”、阿里“通义千问”、腾讯“混元”、智谱“清言”、深度求索“DeepSeek”等 1509个大模型产品,数量居全球首位,国内人工智能企业超 5100 家,全球占比约 15%,持续拉动对算力基础设施需求。
AI 落地应用方面,OpenClaw(曾用名 Clawdbot、Moltbot)俗称“龙虾”,是一款开源、本地优先的 AI Agent 框架,通过单个 Gateway 网关进程将聊天应用连接到 Pi等编程智能体,把大型语言模型(LLM)从“会聊天”的对话工具,转变为能够直接操作用户计算机、执行跨平台、跨应用复杂任务的助手。OpenClaw 推出后,国内互联网巨头迅速展开本土适配和算力支持,腾讯轻量云 Lighthouse 首发 OpenClaw 一键部署模板和可视化面板,百度智能云推出基于轻量应用服务器配置的 OpenClaw 部署方案。
OpenClaw 走红验证 Agent AI 落地可行性,互联网巨头顺势推出对标 OpenClaw的自有产品:2 月底,阿里正式开源 CoPaw 个人智能体工作台,从底层架构到用户体验全面重构产品;3 月 6 日,小米基于 MiMo 大模型构建的 AI 交互测试产品 Xiaomimiclaw 开启小范围封测;3 月 9 日,腾讯全场景 AI 智能体 WorkBuddy 和火山引擎SaaS 版助手 ArkClaw 正式上线;3 月 10 日,智谱上线本地一键部署的 AutoClaw;3月 11 日,华为基于鸿蒙系统推出“小艺 Claw”Beta 版。国外大模型方面,谷歌在 FY2025Q4 财报电话会议透露,以 Gemini 为代表的公司自研模型,通过API调用每分钟消耗Token就超过100亿。2026年4月7日Anthropic联合苹果、英伟达、微软、AWS、谷歌等 11 家科技巨头,启动 Project Glasswing 项目,同时发布前沿 AI 模型 Claude Mythos Preview 用于网络防御。
2026 年 4 月 23 日,OpenAI 正式发布新版本模型 GPT-5.5 和 GPT-5.5 Pro,据公司介绍,GPT-5.5 更加擅长处理编写并调试代码、操作软件以及跨工具完成任务等能力,目前已向 ChatGPT和 Codex 付费用户开放。据公司发布的测试成绩,GPT-5.5 在编程、专业任务、科研等领域全方面领先 Anthropic 的 Claude Opus 4.7 以及谷歌的 Gemini 3.1 Pro。算力租赁方面,据行业监测,年来2026AI 算力需求激增驱动算力租赁市场进入涨价周期。
英伟达全系列 GPU 在云端数据中心的现货租赁价格均大幅上涨,具体来看:Ornn Compute 价格指数显示,4 月英伟达最先进的 Blackwell 系列芯片时租价格达 4.08 美元/卡时,较两个月前的 2.75 美元/卡时上涨 48%。在 GPU 租赁价格高位运行的背景下,算力供需持续紧张,据半导体研究机构 SemiAnalysis,3 月英伟达 H100一年期合同时租价格 2.35 美元/卡时,较 2025 年 10 月的 1.70 美元/卡时涨幅近 40%,表明较老的 GPU 需求仍然旺盛。为应对算力市场成本的变化,国内外巨头也开始新一轮调价周期。
国内方面,阿里云本周(4 月 13-17 日)内连续宣布三次涨价:13日宣布调整DataWorks 标准版、专业版用户的 API 免费额度并支持按量付费;15 日宣布大模型服务平台百炼部分模型单元服务涨价 2-5%;15 日宣布对 DDoS 防护产品调价。
国外方面,Anthropic 隐形上调产品价格:企业级产品 Claude Enterprise 订阅模式从每月每用户最高 200 美元的固定费用,转变为按照实际算力消耗收费外加每月固定缴纳的20美元,软件授权谈判协助公司Redress Compliance联合创始人FredrikFilipsson 表示,新定价可能导致重度用户成本翻倍甚至三倍。
国内大模型方面,2026 年 4 月 2 日,火山引擎表示豆包大模型日均 Token 使用量已突破 120 万亿,较三个月前增长一倍,较 2024 年 5 月份首次发布时增长超 1000倍。据晚点 LatePost 报道,日前全球仅三家公司日均 Token 消耗量超过 100 万亿:OpenAI、Google 和字节跳动。其中字节跳动 Token 消耗主要来自中国市场,旗下视频生成模型 Seedance 2.0 API 尚未在海外正式上线,海外市场仍有较大增长空间。
在模型层面,最新的豆包大模型 2.0 系列在多模态理解、复杂任务执行等核心能力上实现突破,跻身全球第一梯队。2026 年 4 月 2 日,阿里发布国产最强编程模型Qwen3.6-Plus,当晚正式版上线 OpenRouter,单日调用量突破 1.4 万亿 Token,增长711%并登顶日榜榜首,同时大幅刷新了平台单日调用的纪录。
此外,千问很快还将发布 3.6 系列的旗舰模型 Qwen-3.6-Max。2026 年 4 月 24 日, DeepSeek -V4 系列模型上线并同步开源,V4 系列模型包含flash 和 pro 两个 MoE 模型版本。其中 pro 版本主要为满足高性能研发,总参数 1.6T,激活参数 49B,支持上下文长度 1M,模型在 Agentic Coding 评测中达到当前开源模型最佳水平,且在数学、STEM、竞赛型代码等推理任务评测中超过所有已参加过公开评测的开源模型,性能接近世界顶级闭源模型;flash 版本主要为满足经济高效部署需求,总参数 284B,激活参数 13B,支持上下文长度 1M。
DeepSeek-V4 开创了一种全新注意力机制,能够在 token 维度进行压缩,结合 DSA 稀疏注意力机制实现了全球领先的百万字上下文能力,相对传统路径大幅降低了对硬件层面计算和显存的需求。适配方面,华为云表示旗下产品华为云 MaaS 模型即服务平台已提供支持,提供免部署、一键调用 DeepSeek-V4-Flash API 的 Tokens 服务。Scaling Law 拓展至多领域,多模态模型带动 tokens 消耗量增长。模型训练方面,Scaling Law 从预训练扩展到后训练和推理阶段,模型不光随着参数量提升而提高性能,还能基于强化学习、思维链等算法创新在后训练和推理阶段更多的算力投入,可以进一步大幅提升大模型的深度思考能力。
据 OpenAI 介绍,GPT-4.5 使用了10 万张 GPU 卡进行训练,在开发 OpenAI o3 时在训练计算和推理时间方面都增加了一个数量级,发现了明显的性能提升,验证了模型的性能会随着思考的次数而不断提高,并首次将图片整合到思维链中,算力需求持续提升。模型推理方面,DeepSeek带来的算法效率的提升并未抑制算力需求,反而因更多的用户和场景的加入,推动AI 大模型普及与应用落地,此外随着从语言模型逐步走向多模态,单次推理 tokens消耗量或将大幅提升,进而带动数据中心、边缘及端侧算力建设。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。