ai-identity-security
$
npx mdskill add wgpsec/AboutSecurity/ai-identity-securityTest role escape and permission bypass in AI agents.
- Detects unauthorized actions and credential leaks in multi-agent systems.
- Integrates with MCP servers, API keys, and session token mechanisms.
- Executes payloads to simulate identity theft and privilege escalation.
- Reports detected vulnerabilities with specific attack vectors and GAARM codes.
SKILL.md
.github/skills/ai-identity-securityView on GitHub ↗
--- name: ai-identity-security description: | AI 系统身份与权限安全测试方法论。当目标系统涉及 Agent 身份认证、多 Agent 权限管理、 角色设定安全、会话管理、或 MCP/API 凭据管控时触发。 覆盖: 角色逃逸(假定场景/假定角色/遗忘法/目标劫持)、权限失控(Action 越权/MCP 未授权资源获取)、 多 Agent 身份伪造、会话劫持、凭据泄露与滥用。 metadata: tags: ai identity, role escape, 角色逃逸, agent impersonation, 身份伪造, action permission, 权限失控, session hijack, 会话劫持, credential abuse, mcp unauthorized, 凭据泄露, multi-agent identity, 越权访问 category: ai-security --- # AI 身份与权限安全测试方法论 ## 概述 AI 身份安全关注的是**应用层角色设定与权限边界**的可靠性。与 prompt-jailbreak(针对模型安全对齐)不同,身份安全测试的目标是验证业务赋予 AI 的角色限制、权限分配、会话隔离和凭据管控是否可被绕过。当 Agent 获得工具调用和外部系统访问能力后,身份失控的影响从"说了不该说的话"升级为"做了不该做的事"。 ## 攻击面总览 | 攻击类别 | 子攻击 | GAARM 编号 | |----------|--------|-----------| | 角色逃逸 | 假定场景 / 假定角色 / 遗忘法 / 目标劫持 | 0052.001-004 | | 权限失控 | Action 模块越权 / MCP 未授权资源获取 / 账户越权 | 0053/0057/0058 | | 身份伪造 | 会话令牌窃取 / Agent 身份伪装 / 信任链欺骗 | 0059 | | 会话与凭据 | 会话劫持 / 缓存欺骗 / API Key 泄露 | 0055/0056 | ## 深入参考 - 各攻击类别的详细测试 Payload、攻击链与检测方法 → [references/identity-attack-techniques.md](references/identity-attack-techniques.md) --- ## Phase 0: 身份架构侦察 - 识别 Agent 认证方式(API Key / OAuth / Session Token / 无认证) - 枚举权限模型(RBAC / ABAC / 无显式权限控制),确认角色设定的实现方式(system prompt / 代码逻辑 / 配置文件) - 探测会话管理机制(会话 ID 生成方式、过期策略、跨会话隔离程度) ## Phase 1: 角色逃逸测试 (GAARM.0052) - **假定场景逃逸**:构造混淆场景使模型偏离工作目标,结合关键字定位尝试泄露系统设定 - **假定角色逃逸**:要求模型扮演特定角色(DAN / 开发者模式),使其忽略应用层角色限制 - **遗忘法逃逸**:诱导模型"忘记"先前的角色指令,重置为无约束状态 - **目标劫持**:通过操纵使 AI 偏离原始角色设定去执行攻击者期望的任务 角色逃逸与越狱的边界:jailbreak 攻击模型的安全对齐(让模型生成有害内容),角色逃逸攻击应用的业务角色设定(让客服 Bot 执行管理操作)。两者可组合使用但测试目标不同。 ## Phase 2: 权限失控测试 (GAARM.0053/0057/0058) - **Action 模块越权**:通过 Prompt 注入或参数篡改,触发 Agent 执行超出授权范围的 Action(如将普通查询操作替换为管理操作) - **MCP 未授权资源获取**:测试 MCP Server 权限验证是否存在缺陷,恶意 Server 能否绕过权限检查访问系统资源(详见 `mcp-security`) - **账户越权**:验证 Agent 在多租户场景下是否能跨账户访问数据 ## Phase 3: 多 Agent 身份伪造 (GAARM.0059) - **会话令牌窃取**:通过 Prompt 注入诱导 Agent 输出会话凭据或将其发送到外部端点 - **Agent 身份伪装**:在多 Agent 系统中伪造来自高权限 Agent 的消息,欺骗目标 Agent 执行越权操作 - **信任链欺骗**:利用 Agent 间的隐式信任关系,通过攻陷低权限 Agent 间接控制高权限 Agent ## Phase 4: 会话与凭据安全 (GAARM.0055/0056) - **会话劫持**:测试会话 ID 的可预测性、固定性和传输安全性 - **缓存欺骗**:验证 CDN/代理缓存是否可能泄露包含认证信息的响应 - **API Key 泄露**:检查 Agent 配置中的凭据是否可通过 Prompt 注入被诱导输出 --- ## 检测清单 ``` 1. [ ] 身份架构已侦察?认证方式、权限模型、会话管理机制已明确? 2. [ ] 角色逃逸:假定场景/角色/遗忘法/目标劫持是否能突破角色设定? 3. [ ] 权限失控:Action 参数是否可被篡改?MCP 权限验证是否完整? 4. [ ] 身份伪造:多 Agent 间消息来源是否经过验证?信任链是否可被利用? 5. [ ] 会话安全:会话 ID 是否安全生成?是否存在固定会话攻击面? 6. [ ] 凭据管控:API Key 和 Token 是否可通过注入被泄露? 7. [ ] 跨租户隔离:多租户场景下数据访问边界是否可靠? ``` --- ## 参考资源 - [GAARM Framework — AI Agent 攻击分类](https://github.com/ArcadeAI/GAARM) - [OWASP Agentic AI Security — ASI03 Identity & Access](https://owasp.org/www-project-agentic-ai-security/) - [MCP-Remote 高危漏洞分析](https://invariantlabs.ai/blog/mcp-remote-vulnerability) - [CVE-2025-49596 — MCP 浏览器命令执行](https://www.cve.org/CVERecord?id=CVE-2025-49596)
More from wgpsec/AboutSecurity
- 401-403-bypass401/403 访问拒绝绕过方法论。当遇到管理后台、API 端点返回 401/403 Forbidden 时使用。覆盖路径操纵、HTTP 方法篡改、Header 注入、协议降级、组合攻击
- ad-acl-abuseActive Directory ACL 滥用攻击方法论。当 BloodHound 发现 GenericAll/WriteDACL/WriteOwner/GenericWrite/ForceChangePassword 等危险 ACE 时使用。覆盖 ACE 枚举、权限滥用链、Shadow Credentials、RBCD 攻击
- ad-delegation-attackKerberos 委派攻击(非约束/约束/RBCD)。当 BloodHound 发现委派配置、或已获取有 SPN 的服务账号/机器账号控制权时使用。通过 S4U 协议滥用可实现跨服务模拟任意用户,常用于域内权限提升和横向移动。
- ad-domain-attackActive Directory 域环境攻击全链路。当目标主机在域环境中(systeminfo 显示 Domain 非 WORKGROUP)、发现 88/389/636 端口、或获取到域用户凭据时使用。覆盖域信息收集、用户枚举、Kerberoasting、AS-REP Roasting、委派攻击、ACL 滥用、DCSync、Golden/Silver Ticket
- ad-persistenceAD 域环境持久化技术。当已获取域管/本地管理员权限、需要建立持久访问以确保重启或密码更改后仍能回到目标环境时使用。覆盖主机级持久化(计划任务/注册表Run/COM劫持/WMI事件订阅/Windows服务/启动文件夹)、域级持久化(Golden Ticket/Silver Ticket/Skeleton Key/DSRM/AdminSDHolder)、DCShadow/GoldenGMSA高级技术、清理命令与检测规避
- ad-trust-attack域信任关系攻击。当目标存在多域/多林环境时使用。包含父子域提权(Golden Ticket + ExtraSid)、跨林攻击(SID History/MSSQL Trust Links)、单向信任利用。已获取子域 Domain Admin 或发现信任关系时优先加载。
- adcs-certipy-attackActive Directory Certificate Services (ADCS) 证书攻击。当发现域内有 CA 服务器、ADCS Web Enrollment、证书模板配置错误时使用。覆盖 ESC1-ESC11 所有证书滥用路径、Certipy 工具链、证书伪造、NTLM 中继到 ADCS。发现 ADCS/CA/证书/certsrv 相关内容时一定要使用此技能
- adinfo-enum使用 Adinfo 进行 Active Directory 信息收集。当获得域用户凭据后需要快速收集域环境信息时使用。Adinfo 是一个快速 AD 信息收集工具,一条命令输出域控列表、域管用户、信任关系、GPO、SPN、委派配置等关键信息——比手动 LDAP 查询快得多。发现域环境后第一步信息收集使用此技能
- agent-security|
- ai-data-security|