【
智慧城市网 视点跟踪】2025年,国务院印发《关于深入实施“人工智能+”行动的意见》,提出到2027年,新一代智能终端、智能体等应用普及率超70%,为智能体规模化应用明确了阶段性目标。2026年5月,国家网信办、国家发改委、工信部联合发布《智能体规范应用与创新发展实施意见》,进一步提出夯实发展基础、完善技术底座、构建标准协议,促进智能体规范应用与创新发展。在此背景下,智能体正从演示验证走向生产应用,价值由内容生成、智能问答延伸至任务规划、工具调用和系统执行,产业关注点也从模型能力转向稳定、低成本、可复用的智能体基础设施。智能体基础设施是支撑智能体开发、运行、协同和治理的基础体系,也是将模型能力转化为可调用、可运行、可治理系统能力的关键底座。
一、智能体工程化从模型交互走向系统执行
从工程实践看,大模型应用的演进正在从“提升单次生成效果”转向“保障复杂任务执行”。围绕模型外部运行环境构建系统能力,正成为智能体进入生产环境的关键。总体来看,智能体工程化可概括为Prompt工程、Context工程和Harness工程三个层次:Prompt解决模型“如何理解任务”,Context解决模型“依据什么信息作答”,Harness解决智能体“如何在真实系统中可靠执行”。
Prompt工程主要提升模型对任务的理解能力。通过提示词设计、角色设定和任务描述等,开发者可改善模型输出质量,支撑文本生成、代码辅助、知识问答等场景快速落地。但其更多面向单次或短链路交互,难以应对企业场景中的知识更新、状态保持和跨系统执行需求。
Context工程主要提升模型获取和利用信息的能力。通过检索增强生成、长上下文、知识库接入和记忆机制等,模型能够获得更贴近业务场景的外部信息,增强垂直领域适配性。但在长任务、多工具、多轮协同场景下,上下文仍可能出现信息冗余、状态丢失和目标漂移等问题。
Harness工程则面向智能体可靠执行。当智能体从内容生成走向任务执行后,系统需要支撑工具调用、任务编排、执行隔离、人机审批、过程追踪和结果评测等能力。其核心目标是让智能体在真实业务环境中持续、可控、可追踪地完成任务。
二、成本、稳定性、可信成为智能体基础设施的核心痛点
智能体工程化从Prompt到Context再到Harness的递进,本质上是从“让模型回答问题”向“让系统完成任务”的范式转变。前两个层次更多服务于模型推理优化,而进入Harness层次后,智能体需要在复杂业务环境中自主完成多步骤任务,支撑其落地的智能体基础设施必须从零散辅助工具升级为体系化运行底座。近期,中国信息通信研究院对覆盖通信、金融、能源、交通等18个行业的84家企业进行了调研,发现53.6%的企业建设智能体基础设施的核心目标是提升效率,但在实际建设及应用过程中,51.2%的企业认为计算资源及部署运维成本高是首要瓶颈,47.6%的企业反映标准不统一、技术兼容性差问题突出,64.3%的企业表示数据可信风险是制约建设发展的关键因素。这说明,智能体基础设施的规模化落地难点已不只是“能不能构建智能体”,而是能否以可承受的成本、可持续的稳定性和可验证的可信机制,将智能体真正纳入企业级生产系统。
高昂的综合成本是制约智能体基础设施大规模普及的首要障碍。智能体多步骤执行、多工具调用、长上下文持续维护等特性,使其算力消耗远高于传统大模型应用。除基础推理成本外,定制化开发、跨系统集成和持续运维的投入也居高不下。许多中小企业难以承担完整的体系化建设成本,只能采用碎片化解决方案,无法充分发挥智能体基础设施的协同优势。据Gartner预测,超过40%的agentic AI项目可能因成本上升、业务价值不清或风险控制不足在2027年底前被取消[1]。
标准缺失导致的技术碎片化与运行不稳定性,严重影响生产级应用效果。当前行业缺乏统一的技术标准和接口规范,不同厂商的智能体基础设施产品兼容性差,企业面临严重的供应商锁定风险。同时,智能体在复杂业务环境中仍存在任务执行失败、工具调用错误、状态异常丢失等问题,缺乏完善的异常处理和故障恢复机制,难以满足企业级应用对高可靠性的要求。Anthropic在Claude Computer Use官方文档中明确提示,模型在选择工具、生成操作或同时交互多个应用时可能出现错误、幻觉或意外动作。
可信风险是智能体接入企业核心业务的最大拦路虎。智能体的自主性和黑箱特性使其行为难以完全预测和控制,数据泄露、权限滥用、恶意执行等风险突出。据媒体报道,三星工程师曾被报道在使用ChatGPT辅助工作时泄露源代码和内部会议记录,反映出企业在引入大模型与智能体工具时必须加强数据边界、权限控制和使用审计。此外,智能体生成内容的真实性、决策过程的可解释性以及责任归属问题尚未得到有效解决,这使得企业在将智能体应用于金融、医疗、政务等敏感领域时顾虑重重。
三、亟需建设稳定、可靠的智能体基础设施工程体系
成本、稳定性和可信问题集中暴露出,智能体规模化落地的关键已不只是模型能力本身,而是能否构建一套面向真实业务环境的工程化支撑体系。麦肯锡2025年全球AI调研显示,62%的受访组织已至少开始试验人工智能智能体,但在任一单一业务职能中实现规模化应用的比例均不超过10%[2]。这说明,智能体当前并不缺少概念验证和局部试点,真正瓶颈在于如何跨越从“能演示、能试用”到“可稳定运行、可持续运维、可可信接入”的工程鸿沟。智能体基础设施的核心价值,正是围绕任务执行全流程,形成能力连接、记忆状态、应用编排、运行环境、观测评测和可信管控等系统能力,把模型能力转化为可复用、可管理、可追踪、可治理的企业级工程能力。
能力接入与连接管理是智能体对外交互的基础枢纽。智能体执行任务需要调用模型、知识库、工具、数据库、业务系统和外部服务等多元能力。据中国信通院调研,44.0%的企业愿意在能力接入层追加预算,反映出企业对统一连接底座的现实需求。面向生产环境,智能体基础设施应提供能力注册、协议适配、模型路由、工具管理、API网关和版本治理等能力,降低重复适配成本,减少工具调用失败和系统耦合风险,使智能体能够稳定、可靠地调用外部能力。
记忆与状态管理是长任务可靠执行的核心保障。当任务从单轮问答转向多步骤执行后,智能体需要持续维护任务历史、长期记忆、中间状态和知识更新能力。这一能力的核心价值在于保障长任务执行过程中的上下文连续性,有效避免状态丢失、目标漂移和重复执行等常见问题,提升智能体在复杂业务流程中的可靠性。
应用编排与运行环境是复杂任务落地的关键支撑。复杂业务任务通常涉及多步骤拆解、多工具调用甚至多智能体协同,据中国信通院调研,当前33.3%的企业已应用多Agent协作,25.0%的企业采用单Agent与工具混合调用模式。智能体基础设施需要提供任务编排、资源调度、推理服务、执行隔离和异常恢复等能力,确保智能体在复杂环境中稳定运行。
运营运维与观测评测是智能体持续进化的必要手段。随着智能体自主性提升,企业对其运行透明度、效果可评估性和成本可控性的要求日益迫切。围绕任务全流程建立日志追踪、链路观测、运行监控、质量评测、成本统计、告警处置和反馈闭环的能力体系,能够帮助企业持续发现问题、优化策略,支撑智能体基于反馈实现自进化。
可信管控是智能体接入核心业务的前提条件。智能体逐步深入企业核心业务系统后,调用权限和行为边界问题愈发突出,据中国信通院统计,41.7%的企业愿意在可信管控层增加预算。通过构建身份鉴权、数据可信、运行可信和审计日志等能力体系,能够保障智能体在企业环境中的合规运行和风险可控。
四、以标准牵引和生态协同推动智能体基础设施高质量发展
总体来看,智能体基础设施已成为智能体由演示验证迈向生产应用的关键基础设施,其价值不仅在于降低智能体开发门槛,更在于把能力接入、状态管理、应用编排、观测评测和可信治理沉淀为可复用、可评估、可治理的产业共性能力。面对成本高、稳定性不足、标准不统一、可信治理机制不完善和供需匹配不充分等落地痛点,中国信通院联合中国人工智能产业发展联盟正在围绕标准规范、产业研究、测试评估和生态培育等方向系统推进相关工作,包括研制《智能体基础设施技术要求》标准、编制智能体基础设施研究报告等,欢迎各企业伙伴积极参与相关工作。