人工智能旨在使机器具备感知、认知、推理、学习、规划与执行等智能行为。自诞生以来,人工智能已历经四个清晰的发展阶段,逐步从单一功能的计算工具向具备自主决策与执行能力的通用智能系统演进。
第一阶段为统计学习时代(1990 年起),主要解决特定领域的规则化问题;
第二阶段为深度学习时代(2009年起),以语音识别、人脸识别等专用大模型为里程碑,实现了单一模态感知能力的突破,其中大规模语音识别技术是人工智能技术走向实用化的重要起点;
第三阶段为通用大模型时代(2022 年起),以 ChatGPT 为代表,实现了“一个模型解决任意任务”的跨越;
第四阶段为智能体时代(当前及未来),人工智能正从被动响应的“生成智能”向主动执行的“执行智能”演进,具备规划推理、工具调用与群体协同能力的智能体成为核心方向,而广义具身智能体作为智能体技术与物理世界融合的产物,成为全球人工智能领域国际竞争的战略制高点。
在人工智能演进过程中,语音交互到对话系统的发展是贯穿始终的核心主线,也是人工智能从“能听会说”向“能理解会思考”进化的最直接体现。语音作为人类最自然的交互方式,其技术突破不仅是深度学习时代的首个标志性成果,更逐步发展为覆盖“听、说、看、想”全维度大脑功能的交互式多模态语言计算系统。对话智能本质上是具备多模态处理能力的通用人机交互大脑,天然适配智能体时代“感知—决策—行动”的系统架构要求,是连接数字世界与物理世界、实现具身智能的核心技术基础。
当前,全球主要经济体正加速布局人工智能。仅 2025 年至 2026 年初,美国即启动“星际之门”计划(四年 5000 亿美元),视人工智能为 21 世纪重塑全球力量平衡的关键;欧盟推出InvestAI 计划(2000 亿欧元),明确提出成为全球AI 领导者;日本出台五年 1 万亿日元的国产 AI 支援计划;韩国将 AI 确立为国家战略核心,成立总统直属的国家 AI 战略委员会。
我国将人工智能定位为发展新质生产力的核心引擎,2025 年国务院发布《关于深入实施“人工智能+”行动的意见》,2026 年《政府工作报告》首次提出“打造智能经济新形态”,标志着人工智能从技术赋能工具上升为系统性的经济新形态。据 IDC 预测,预计到2028年,中国人工智能总投资规模将突破1,000亿美元,五年复合增长率为35.2%。
人工智能正深刻渗透汽车、办公、家居、机器人、消费电子、教育、医疗等众多行业,催生新产业、新业态、新模式,成为驱动经济增长的关键变量。
(2)人工智能的产业链及市场规模
在大模型技术爆发前,全球人工智能产业普遍采用基于技术栈的垂直分层分类法,这也是目前行业最基础、最通用的架构标准。人工智能产业体系按照产业链的不同环节可以划分为基础层、技术层和应用层。基础层提供人工智能发展的核心支撑,包括计算硬件、数据资源和算法框架;技术层负责人工智能的核心算法研发、模型训练和优化,提升 AI 系统的智能化水平;应用层则是人工智能技术的具体落地,涵盖各类行业应用和商业化模式。这一产业架构形成了从底层支撑到上层应用的完整生态,推动人工智能在不同场景中的普及和深化。
随着 2022 年以来大模型智能体技术的持续演进、应用场景的爆发式拓展,传统三层架构的局限性逐渐显现:产业链分工不再严格按照“技术栈上下游”划分,而是向“横向生态位分工”演变。市场参与者的定位日益清晰,跨层整合与专业化细分同时发生,形成了单点 AI 技术公司、AI 应用产品公司和全栈 AI 系统公司三类核心主体。
随着对话式 AI 技术持续演进、应用场景不断拓展,产业链分工正逐步细化,市场参与者的生态位亦日益清晰。三类公司在产业链中承担的职能不同,分别对应底层能力供给、终端产品承载以及系统整合与场景落地等不同环节,共同构成了大模型时代人工智能产业的完整生态。
单点 AI 技术公司主要提供底层单一 AI 模型和云能力,将相关能力做成标准化的基础能力模块,并通过模型授权、API 调用等方式向下游客户输出。该类公司通常是单一模型公司,即聚焦某一个细分 AI 模型赛道,只输出单一模型的原子能力,例如仅提供大模型、视觉模型或语音模型等能力。其核心竞争力通常体现在某一类模型能力的持续优化、性能提升及规模化调用能力。换言之,该类公司更强调单点技术深度,其商业模式也通常围绕单一模型能力输出展开。
AI 应用产品公司主要面向终端市场制造和销售最终产品,将 AI 能力集成至具体硬件形态和应用场景中,直接服务于消费者或企业用户。该类公司通常更强调产品定义、用户体验、品牌和渠道能力,其核心在于将 AI 能力转化为可感知、可使用的终端产品,但在底层模型体系和系统架构层面的覆盖范围通常相对有限。
而全栈 AI 系统公司则位于技术能力与终端产品之间的关键枢纽位置,是端云协同、软硬结合的全栈 AI 赋能者。其全栈通常具有双重含义:一方面,具备全领域多模型自研能力,覆盖语音、视觉、大模型、多模态等多个方向,能够支持不同模型能力之间的协同;另一方面,具备从模型、技术架构、软件、硬件到行业解决方案的全系统协同创新能力,能够实现软硬件一体化和端到端落地。
因此,系统级公司输出的并非单一模型能力,也并非单一终端产品,而是围绕具体应用场景形成的完整解决方案。相较于单一模型公司专注于某一类模型能力并以模型输出为主要模式,系统级公司更强调多领域模型能力与系统能力的深度整合,其竞争力来自全领域多模型自研、系统架构、软硬件一体化和工程落地的整体能力。
从产业链协同关系看,技术型公司、产品型公司和系统级公司共同构成了对话式 AI 产业生态中的不同环节。其中,系统级公司承担着将底层技术能力转化为场景化解决方案的重要角色。尤其在各类复杂终端场景中,客户需求通常并非停留在单一模型调用层面,而是需要兼顾模型协同、系统架构、软硬件适配、部署实施和后续迭代能力的整体方案。在此背景下,对话式 AI 解决方案就是通过整合多领域 AI 能力与具体场景需求,形成可部署、可交付、可持续优化的完整系统方案。
根据工业和信息化部数据,2025 年我国人工智能核心产业规模超过 1.2 万亿元,同比增长超过 33%;人工智能企业数量超过 6,200 家,形成覆盖基础底座、模型框架、行业应用的完整产业体系。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。