首 页
研究报告

医疗健康信息技术装备制造汽车及零部件文体教育现代服务业金融保险旅游酒店绿色环保能源电力化工新材料房地产建筑建材交通运输社消零售轻工业家电数码产品现代农业投资环境

产业规划

产业规划专题产业规划案例

可研报告

可研报告专题可研报告案例

商业计划书

商业计划书专题商业计划书案例

园区规划

园区规划专题园区规划案例

大健康

大健康专题大健康案例

行业新闻

产业新闻产业资讯产业投资产业数据产业科技产业政策

关于我们

公司简介发展历程品质保证公司新闻

当前位置:思瀚首页 >> 行业新闻 >>  产业科技

智能体产业应用技术挑战
思瀚产业研究院 腾讯    2025-10-16

智能体正从概念走向实践,然而,任何一项革命性的技术落地都非坦途。与传统IT项目不同,智能体的落地挑战不仅源于技术本身,更在于其与企业既有业务、数据、系统和安全体系的深度耦合。本报告将系统性地剖析智能体在企业应用落地的六大核心挑战,希望帮助企业以清晰的风险意识,开启智能体建设的征程。

训推成本:以架构升级破解经济性难题

智能体应用正将大模型从“对话生成”推向“自主执行”的复杂业务场景,然而,这一跃迁也带来了严峻的成本挑战。一方面,大模型因其庞大的参数量与数据处理需求,对训练和迭代的资源要求极高;另一方面,智能体的工作流包含感知、规划、工具调用、反思等多个复杂步骤,单次任务的Token消耗量远超简单问答,导致推理成本急剧增长。同时业务负载的“潮汐效应”——高峰期需求激增,低谷期资源闲置,与传统的静态算力部署模式形成尖锐矛盾,使得企业陷入“用不起、跑不动”的困境,算力投资仿佛掉入“黑洞”,难以转化为可控的业务效能。

挑战:智能体落地的成本困境,本质上是其复杂工作模式与传统算力架构之间的不匹配,我们可以将其拆解为四个层面。在基础设施层,智能体执行复杂任务时,往往需要在多卡、多节点间进行并行计算与频繁通信。传统的网络架构可能成为瓶颈,一旦通信效率跟不上,整体性能便会严重受限,导致计算资源利用率大幅下降,无形中增加了时间与机会成本。

在算力调度层,企业内部的算力资源往往呈碎片化分布,缺乏统一、智能的调度机制。这导致GPU等宝贵资源利用率低下,大量算力处于闲置或低效运行状态,成本无法有效摊薄。在服务部署层,传统的模型服务部署框架在应对智能体带来的高并发、长序列请求时,容易出现推理队列积压,导致服务延迟飙升,严重影响用户体验与业务连续性。在模型框架层,大模型本身计算密集、内存消耗巨大,若缺乏针对性的底层框架优化,硬件的潜力就无法被充分释放。这不仅仅是算法问题,更是复杂的系统工程挑战。这四个层面的挑战相互交织,共同构成了智能体应用落地的成本壁垒。单纯依靠“堆硬件”的粗放式投入,不仅成本高昂,更无法从根本上解决效能问题。真正的破局之道在于对整个技术栈进行系统性的重构与优化,将算力从“成本中心”转变为驱动业务增长的“效能引擎”。

解决思路:为应对上述挑战,行业正积极探索从IaaS到PaaS的全栈协同优化方案,通过系统级的技术整合,实现端到端的降本增效。

构建AI原生的弹性基础设施:

通信优化:采用专为AI负载设计的网络通信技术(如RDMA的升级与优化),解决跨节点通信瓶颈,确保大规模集群的近无损扩展,让数据在计算节点间高效流转。

智能调度:引入全局智能调度平台,实现对多云、多地域、多异构算力的统一编排。通过“潮汐调度”等模式,在推理任务低峰期将闲置算力自动分配给训练或精调任务,实现算力资源的动态“削峰填谷”,将整体利用率最大化。

打造高效能的模型服务与推理框架:

先进服务架构:采用“Prefill/Decode分离”(PD分离)等先进部署架构。针对任务的不同阶段(如长文本理解的Prefill阶段和逐字生成的Decode阶段)采用不同的并行策略(如张量并行、专家并行、数据并行等),最大化利用计算与显存资源,在不影响精度的情况下大幅提升吞吐率,降低单位请求成本。

模型深度优化:在模型框架层进行深度优化。这包括但不限于:使用模型量化(如int4/int8)技术压缩模型体积;重写关算子以适配最新硬件特性;应用多令牌预测(Multi-Token Prediction, MTP)等技术,通过一次前向计算预测多个Token,显著提升生成速度。这些优化技术的组合,能将硬件潜力压榨到极致。

通过上述体系化的架构升级,旨在将“堆砌算力”的粗放模式,转变为“精耕细作”的效能模式,让每一份算力投入都产生最大价值,最终使智能体应用真正“跑得动、用得起”,从昂贵的“奢侈品”变为企业数字化转型中不可或缺的“生产力工具”。

模型性能:幻觉与泛化性的双重困境

智能体在应用中面临的性能挑战,核心在于通用大模型的知识局限性和生成机制的固有缺陷。一方面,通用大模型虽然在海量公开数据上表现出色,但其在垂直领域的专业知识存在缺失,导致泛化能力不足。另一方面,大模型基于概率生成内容,存在固有的“幻觉”问题,即生成看似合理但与事实不符或缺乏依据的信息。在需要自主执行任务的智能体场景中,幻觉可能导致错误的决策和危险的行为,影响系统可靠性。

挑战:通用大模型的知识是“静态”且“宏观”的。当面对特定企业的内部流程、专业术语、最新业务数据或实时信息时,其知识存在“鸿沟”。例如,一个智能体需要理解最新的内部风控政策,或根据最新的临床指南辅助决策,但通用模型原生并不具备这些知识。当其面对不熟悉的问题时,会倾向于“一本正经地胡说八道”,产生幻觉。更深层次的问题在于,幻觉在智能体场景中会产生“放大效应”。在简单的问答场景中,幻觉可能只是生成错误信息,用户尚能自行判断。但在自主执行的智能体中,幻觉可能导致智能体调用了错误的 API、执行了不当的操作,甚至引发安全事故。

解决思路:为应对模型幻觉与泛化性的双重困境,业界普遍采用一套多层次、相辅相成的技术组合,而非单一的解决方案,以系统性地将通用大模型锻造为精准、可靠且安全的专业智能体。在应用层,通过检索增强生成(RAG)为模型外挂一个动态更新的“事实大脑”。该技术通过构建“检索-生成”的两步模式,在处理任务时先从企业内部数据库、产品文档等可信知识源中精准定位相关信息,再将其作为权威上下文注入提示词,引导模型进行有据可依的回答。这不仅是解决知识性幻觉、确保信息时效性的最直接手段,也相当于为模型提供了“开卷考试”的条件,从根本上降低了其“凭空捏造”的风险。

在模型层,通过微调(尤其是参数高效微调PEFT方法,如LoRA)技术,使用企业高质量的私有数据对模型进行二次训练,我们能够将其内部参数“校准”到特定行业的语境和业务逻辑上,提升模型在专业领域的泛化能力,使其不仅能理解行业术语,更能掌握独特的任务流程、沟通风格与决策模式,使其行为更贴合企业需求的核心环节。RAG与微调并非互斥,而是常常协同使用,前者提供事实,后者优化处理事实的方式。

在对齐层,通过人类反馈强化学习(RLHF)为模型植入一套安全、可靠的行为准则。RLHF通过引入人类评估者对模型的输出进行偏好排序,训练一个“奖励模型”来模拟人类的价值观和安全标准,再以此为指引,持续优化模型,使其生成的内容不仅正确、专业,更要确保其有益、无害、负责任。这是解决更深层次的、涉及偏见与安全风险的“幻觉”问题的关键手段,是确保智能体成为一个值得信赖的数字化合作伙伴的重要防线。

安全防护:从模型到基础设施的立体防御

智能体应用面临的安全挑战是系统性的,涵盖了从模型、应用到基础设施的各个层面。首先,智能体应用本身引入了传统网络安全无法有效应对的新型威胁,如提示词注入、敏感信息泄露和不当的 API 调用。其次,智能体在处理和存储海量敏感数据时,面临数据滥用、隐私泄露和法规不合规的风险。最后,模型和数据部署在云环境或边缘设备上,面临供应链漏洞、运行时攻击和物理入侵等基础设施安全威胁。

挑战:智能体的安全风险贯穿其整个生命周期,而非局限于应用层面。在数据准备阶段,攻击者可通过投毒样本污染训练数据,改变模型行为。在部署推理阶段,恶意用户可通过构造恶意提示词来绕过安全防护,获取模型内部信息或导致敏感信息泄露,即所谓的“越狱”攻击。此外,攻击者还可能通过探测模型参数信息,实施模型窃取,侵犯知识产权。除了模型本身的风险,智能体作为应用系统,其 API 接口和业务逻辑也成为新的攻击面。例如,攻击者可以通过构造恶意 API 请求,绕过安全策略,进行非授权访问或数据滥用。

尽管每个应用都会各自建立安全能力,但这种零散的防护体系可能存在“千里之堤,溃于蚁穴”的风险。传统的网络安全工具(如 Web 应用防火墙 WAF)难以检测和防范这些针对 AI 模型的复杂攻击。这些攻击利用的是模型的语言逻辑漏洞,而非传统的网络协议或代码漏洞。例如,WAF 虽然可以限制 API 请求速率以防范模型抓取,但无法识别恶意提示词注入。因此,智能体安全防护的本质挑战是“非线性”的,解决方案必须从单一的技术防护转向覆盖全生命周期、多维度的治理与技术协同。

解决思路:为构建智能体安全防线,必须建立一个集基础设施安全、模型安全、数据安全和应用安全于一体的多层级的纵深防御体系。

在基础设施安全方面,应采用零信任架构和微隔离技术。通过严格的身份验证和访问控制,确保只有可信的人员和应用能够访问核心算力与数据,同时通过微隔离抑制“东西向”横向渗透,将潜在攻击的危害范围限制在最小。

在模型安全方面,建立常态化的对抗性测试和红队演练机制,模拟越狱、投毒、模型窃取等攻击,提前发现和修复漏洞。同时,部署运行时入侵防范系统,实时监控智能体调用行为,对异常 API 请求进行识别与阻断。

在数据安全方面,从源头进行数据净化和脱敏处理。实施全面的数据丢失防护(DLP)策略,对智能体工作流中的敏感数据进行实时扫描、分类和过滤,防止敏感信息在模型输出中意外泄露。此外,还需通过加密和严格的访问策略,保护模型和数据集等核心资产,防止其被盗窃或篡改。

在智能体应用安全方面,需要针对应用层面的特有风险进行防护。这包括通过 API 安全审计和运行时入侵防范系统,实时监控智能体调用行为。例如,可以设置安全策略,对高频访问或跨系统接口调用等异常行为进行识别与阻断,杜绝第三方滥用 API 导致的数据泄露。同时,通过部署虚拟补丁方案,可以在不中断业务的情况下快速修复针对大模型的复杂攻击。

数据治理:打破数据孤岛 构建可信知识底座

智能体要发挥价值,必须依赖高质量、可信赖的数据。然而,企业内部数据普遍存在两大核心挑战:首先,数据质量参差不齐,来源庞杂,普遍存在重复数据、格式不统一、信息缺失和逻辑冲突等问题。其次,不同业务部门的数据通常存储在各自独立的系统中,形成难以打破的“数据孤岛”。因此,由于业务指标和数据定义缺乏统一标准,导致智能体在面对同一问题时,因数据口径不一而给出相互矛盾的答案,陷入“有数无洞察”的困境。

挑战:“有数无洞察”是智能体应用中普遍存在的业务痛点。当一个智能体需要整合不同部门的数据来生成一份综合报告时,如果财务数据和销售数据对“新客户”的定义不一致,它将无法给出可信的、一致的分析结果。这暴露了底层数据治理的根本性缺陷:技术上的“数据孤岛”与业务上的“语义鸿沟”是核心矛盾。单纯的数据清洗只是解决了物理层面的问题,而未能解决对数据“认知不统一”的深层挑战。数据清洗本身也是一个复杂且高成本的过程,不仅仅是技术问题,更需要业务知识和经验的介入。例如,对于重复数据,需要根据主键和业务含义来判断是否真的重复;对于缺失值,需要根据业务场景和保真度要求,判断是采用统计填充、机器学习预测还是人工补全。这使得数据清洗难以自动化,成为智能体获取高质量知识的巨大障碍。

解决思路:解决数据治理问题,需要自下而上地构建一个完整的、可信的知识底座。首先,建设企业级数据治理中心。该平台应集数据接入、清洗、转换、质量监控与元数据管理于一体。它应具备自动化数据去重、格式统一和信息补全能力,为智能体提供高质量的、可信赖的原始数据。其次,在数据治理中心之上,构建统一语义层与指标平台。该语义层将复杂的底层数据源抽象为业务人员易于理解的业务概念和指标,如“客户订单”、“用户活跃度”等。所有业务指标都在指标平台上进行统一管理,确保所有智能体和应用在调用数据时都遵循同一口径,彻底解决“有数无洞察”的问题。这种从“数据”到“信息”再到“知识”的治理进阶路径,是智能体实现商业价值的基石。

知识解析:高效检索 告别“一本正经地胡说八道”

为真正解决大模型“一本正经地胡说八道”的问题,必须构建一个覆盖知识解析、检索与理解的全链路智能体系,而非仅仅停留在文本检索层面。这一体系面临三大核心挑战:前端的知识源解析不准,即如何处理图文混排、版式复杂的多模态文档;中端的知识检索不全,即如何应对用户口语化的模糊输入,并在海量、异构的知识库中实现精准召回;以及后端的知识理解不深,即如何满足严谨场景下对复杂推理、多步问答及无关信息判断的高要求。这三大挑战环环相扣,共同决定了最终问答体验的可靠性与精准度。

挑战:这些挑战在实际应用中构成了严峻的技术壁垒,其深度远超表面。在解析层面,企业的核心知识往往沉淀在扫描版的PDF、图文并茂的报告或截图等非结构化载体中。传统解析工具在面对这些复杂版式时,常将表格拆解成无序文本,或将图表下的关键注释与正文混淆,导致知识的结构化信息丢失,从源头就注入了“残缺”的知识。在检索层面,矛盾尤为突出。

用户“上季度华东区 A 产品的销售额怎么样?”的口语化提问,可能需要系统同时理解“上季度”的时间范围,定位到“华东区”的地域数据,并从一个上万行、数百列的 SQL 数据库中精准查询。传统 RAG 采用的固定长度文本切片(Chunking)机制,不仅会割裂上下文,更无法与结构化数据库进行有效交互,从而导致检索结果要么遗漏关键信息,要么返回大量不相关的文本片段。

在理解层面,挑战在于深度推理。例如,回答“负责‘凤凰项目’且后续调往欧洲部门的项目经理,他在新岗位的第一个任务是什么?”这类“多跳问题”(Multi-hop QA),需要系统先找到项目经理(第一跳),再查询其调动记录(第二跳),最后找到其新任务(第三跳)。这种逻辑链条的追踪能力,是简单的文本相似度匹配完全无法企及的,模型若缺乏对知识间关联关系的深度理解,便只能给出臆测的、不可信的答案。

解决思路:为系统性地攻克上述难题,行业前沿的解决思路正推动 RAG 架构从固定的流程向具备自主规划与调用能力的 AgenticRAG 框架演进,形成了一套更智能、更精细的解决方案。首先,为攻克解析难题,业界普遍采用先进的 OCR 大模型。这类模型不仅能提取文字,更能理解文档的版面布局,精准还原表格、标题和段落的结构化关系,确保知识在数字化之初就保持高保真度和可用性,为后续所有环节奠定坚实基础。

其次,为化解检索困境,Agentic RAG 会智能地分析用户意图:当识别到需要查询结构化数据时,它会自动调用 Text2SQL 模块,将自然语言转化为精确的 SQL 查询语句;面对非结构化文档,则会启动由向量检索、关键词检索、摘要检索等构成的混合检索引擎,实现广度与深度的平衡。更关键的是,所有初步召回的结果都会经过一个 Reranker(重排序)模型的二次精筛,确保最终喂给大模型的是最核心、最相关的上下文。最后,为实现深度理解与推理,GraphRAG 技术正成为关键突破口。

通过将分散的知识点构建成知识图谱,模型得以洞察实体间的深层关联,从而从容应对“多跳问题”等复杂推理场景。同时,为模型注入无关知识拒答和模糊问题主动澄清的高级交互能力,正使其从一个被动的“答案生成器”升级为一个能思考、会提问、负责任的“智能知识伙伴”,彻底告别“一本正经地胡说八道”。

业务流程耦合:从“助手”到“执行者”的集成路径

智能体的最终价值在于深度融入企业核心业务流程,从“聪明的助手”升级为能推动业务运转的“可靠执行者” 。实现这一跨越的关键瓶颈在于业务流程的深度耦合,这不仅涉及技术层面如何将智能体无缝嵌入企业现有复杂且异构的 IT 系统,更涉及流程层面如何科学地界定人机权责边界,设计出高效协同的新型工作流。

挑战:新旧系统间的技术耦合是基础性障碍 。现代企业的 IT 环境是一个由新旧系统交织而成的复杂网络,包含了 OA、ERP、CRM 等传统系统及大量的自研系统,这些系统形成了难以逾越的“数据孤岛”和“流程断点” 。智能体要实现端到端的任务执行,就必须在这一复杂环境中穿梭,但若无法与现有系统高效、安全地交互,它就会沦为一个“外挂”工具,而非“原生”成员,当智能体无法深度嵌入员工日常依赖的企业协作平台时,其价值将大打折扣 。

与此同时,人机协作的流程耦合是决定应用成败的另一关键 。挑战在于设计一个既能发挥智能体效率,又能保障人类关键决策与监督的混合工作流 。例如,智能体可以起草合同,但最终决策必须由人完成 。如果人机权责边界、审批节点与交接流程设计不当,不仅无法提升效率,反而可能因新的混乱与风险导致项目失败。

解决思路:为实现智能体与业务流程的深度耦合,需要从技术集成和流程设计两个层面协同推进。在技术集成方面,以开放接口集成为基础,实现技术层面的无缝嵌入 。解决新旧系统耦合问题的核心,在于构建标准化的开放接口集成模式。智能体不应作为一个孤立的应用存在,而是应该通过标准化接口,与企业协作平台和核心业务系统深度耦合。

这使得智能体能够实时感知工作上下文(如群聊中的任务指令),并直接在当前平台调用其他业务系统的能力(如创建日历、发起审批),最终将执行结果反馈至当前对话窗口。这种“感知 - 决策 - 执行 - 反馈”的闭环能力,能够彻底打通系统间的壁垒,实现从“对话”到“执行”的无缝衔接。在流程设计层面,以工作流编排为核心,实现人机协作的清晰界定 。

针对人机协作流程耦合的挑战,关键在于引入可视化的工作流编排平台 。通过该平台,业务专家和 IT 人员可以将一个复杂的端到端任务,拆解为一系列标准化的子任务节点 。其中,部分节点可配置为由智能体自动执行的系统调用(如“查询订单状态”),而关键节点则可设定为“人工审批”环节。这种方式将抽象的“人机协同”理念,转化为清晰、可控、可追溯的业务流程图。它不仅明确了智能体与人的权责边界,还使得整个协作过程透明化、规范化,从而在确保业务安全合规的前提下,最大限度地释放智能体的自动化价值。

技术与流程的耦合并非孤立的两条线,而是相辅相成的双螺旋。 强大的技术集成能力为灵活的流程设计提供了基础,而科学的流程设计又为技术能力的释放规划了安全的航道。二者共同构成了智能体融入业务的核心路径。

免责声明:
1.本站部分文章为转载,其目的在于传播更多信息,我们不对其准确性、完整性、及时性、有效性和适用性等任何的陈述和保证。本文仅代表作者本人观点,并不代表本网赞同其观点和对其真实性负责。
2.思瀚研究院一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及文章内容、版权等问题,我们将及时沟通与处理。