明确智能体决策权限保障人工智能安全发展

作者：□特约撰稿刘鑫怡时间：2026/6/10 10:14:45 字体【小中大】

　　随着智能体技术的快速发展，人工智能与人类决策的关系成为法学界与产业界的关注焦点。智能体的核心使命在于通过高速、自动化、智能化的方式执行日益复杂的任务，但智能体的自主性越高、执行能力越强，人类在决策过程中的主体性地位便越容易受到侵蚀。今年5月发布的《智能体规范应用与创新发展实施意见》明确要求界定决策权限，确保用户享有知情权和最终决策权，为破解该问题治理指明了方向。

　　自主性升级诱发智能体决策控制危机

　　智能体行动自主性跃升引发人们担忧。智能体具备自主感知、记忆、交互、决策与执行能力，其存在价值在于可以代替人类行动。智能体决策，指智能体为实现特定目标而选择行动方案的过程，受到算法规则、指令规则及人类干预程度的影响。决策权限来源于两个方面：一方面，人类为追求创新或效率而赋予其授权，例如AI手机可以自主调度与跨应用操作等；另一方面，智能体在自主感知、交互、执行中产生的隐性决策，这来源于智能体涌现出的自主优化与规则重构能力。在人工智能发展过程中，尽管人们始终强调“人类控制”原则，希望确保人工智能系统符合预期功能，但智能体在行动自主性上的跃升，使这一愿景面临严峻挑战。人类自主决策受控风险的表现形式与成因愈发复杂，从单纯的算法错误演变为对控制权的冲击，呈现从研发上游向应用下游扩散之势。

　　智能体行动自主带来多重安全风险。一是自主性溢出。智能体因环境变化、算法局限等原因可能做出不可预测行为，超出人类可预见范围，如智能体在执行任务过程中擅自删除关键邮件或更改系统配置。二是自主性异化。智能体出现“欺骗”“隐瞒”等失范行为，与人类的真实意图发生背离，甚至形成决策对抗。三是自主性被恶意利用。智能体被外部恶意攻击者利用以威胁用户安全，如隐蔽执行黑客指令、开发攻击型应用等。四是产生连锁风险。多智能体互联场景下，单一节点的决策失误可能通过共享上下文迅速扩散，且智能体目标协同不畅等易引发难以追溯与阻断等问题。

　　现有监管框架及准确把握人机决策尺度的路径

　　现有监管框架尚存规制空白。面对智能体自主决策带来的挑战，国内外监管机构虽有前瞻性关注，但仍存在规制空白。国际上，联合国教科文组织于2021年11月通过的《人工智能伦理问题建议书》警示，出于效率性的考虑，人类有时选择依赖人工智能系统，但是否在有限情形下出让控制权依然要由人类来决定。新加坡2026年发布的《智能体人工智能模型治理框架》强调，需对智能体权限进行事前评估与限制，并在关键节点保留人类审批机制。英国信息专员办公室2026年发布的《科技未来：智能体》报告，聚焦智能体在不同使用情景下的自主能力和风险，以及人类实时监督的可行性。我国也积极探索智能体全链条规范决策行为。如《人工智能科技伦理审查与服务办法（试行）》规定，人工智能科技伦理审查应重点关注能否保障使用者对模型、系统的控制、指导和干预能力，特别是将“面向存在安全、人身健康风险等场景的具有高度自主能力的自动化决策系统的研发”列入复核清单。《智能体规范应用与创新发展实施意见》指出，应在遵守法律法规、尊重社会公德和伦理规范的前提下，厘清三类边界：仅限用户本人决策的事项、需由用户授权决策的事项和智能体自主决策的事项，核心在于确保用户对智能体自主决策享有知情权和最终决策权，严禁智能体执行超出用户授权范围的操作。但现有规范多为原则性指引，缺乏应对复杂场景的可操作性细则。面对智能体多步骤执行、动态环境交互及多智能体协同等能力的升级，人类应以何种频率、何种深度参与其中尚无定论。关于决策权限的动态调适机制、风险评估的具体阈值以及多方责任分配，有待进一步明确。

　　把握人机决策尺度。《全球人工智能治理倡议》提出，确保人工智能始终处于人类控制之下，打造可审核、可监督、可追溯、可信赖的人工智能技术。防控智能体决策风险的关键在于以制度与技术双轮驱动，明确人机决策边界，实现自主行动与人类控制的平衡，具体可从以下几个方面入手：

　　第一，以制度规范明确场景化的决策权限归属。决策受控风险的形成，高度依赖于应用场景的敏感度。应当采用分类分级监管策略，对于涉及生命健康、重大财产处置、人身自由、科技伦理等领域的决策，必须坚持“人类控制原则”，限缩智能体的操作空间。对于日常交互和一般性的生活辅助服务，可在充分告知的前提下授予智能体更高的自主权。

　　第二，以技术保障智能体在安全底线内运行。在智能体毫秒级的响应速度面前，传统的人工实时监督已不切实际，必须将法律规制转化为代码约束，将安全护栏、伦理护栏等内嵌于智能体架构，强化身份认证与授权机制，防范恶意攻击行为。应建立动态的权限调整机制，当智能体出现“幻觉”或频繁偏离用户意图时，系统应自动降级其权限，确保其在预设的合规框架内运行，实现“以技治技”。

　　第三，以硬性拦截机制防止未经授权的关键性执行。无论智能体的决策逻辑如何优化，对于涉及敏感数据调用、不可逆的环境状态更改等高风险操作，必须设置强制的人工确认程序，将用户的知情权和决策选择权作为最终结果的闸门，真正实现技术为人所用、为人所控。

　　（作者单位：中国科学技术信息研究所）

明确智能体决策权限 保障人工智能安全发展

明确智能体决策权限保障人工智能安全发展