legal-qa-extractor
$
npx mdskill add cat-xierluo/legal-skills/legal-qa-extractorExtract reusable legal Q&A pairs from client records to build structured knowledge bases.
- Organize client consultations, build FAQs, or create marketing content from dialogue.
- Requires only input text documents containing lawyer-client communications.
- Analyzes dialogue for universal, typical, or educational legal insights.
- Outputs a structured Markdown file containing question, answer, and context.
SKILL.md
.github/skills/legal-qa-extractorView on GitHub ↗
---
name: legal-qa-extractor
homepage: https://github.com/cat-xierluo/legal-skills
author: 杨卫薪律师(微信ywxlaw)
version: "1.0.0"
license: CC-BY-NC-SA-4.0
description: 从律师与客户沟通记录中提取有价值的法律问答对,生成结构化知识库内容。本技能应在用户需要整理客户咨询记录、从对话中提取可复用法律知识、创建问答知识库、或准备内容营销素材时使用。支持严格客户信息脱敏处理。
---
# 法律问答提取技能
## 概述
从律师与客户的沟通记录中提取有价值的**法律问答对**(客户问题 + 律师解答),生成结构化知识库内容。适用于将客户咨询转化为可复用的法律知识,供后续整理成文章、案例或学习材料。
**核心价值**:提取那些可以被其他客户复用的问答内容,而不是单一客户的具体案情。
## 核心原则
### 客户信息保护
**绝对禁止**在问答内容中包含:
- ❌ 客户真实姓名
- ❌ 企业/机构名称
- ❌ 具体地址、联系方式
- ❌ 任何可识别个人或企业的信息
**脱敏处理标准**:
- ✅ 客户姓名 → 使用"当事人"、"客户"、"甲/乙"等代称
- ✅ 企业名称 → 使用"某公司"、"某企业"、"该企业"等代称
- ✅ 具体信息 → 模糊化为"某地"、"某时间"、"相关人员"等
- ✅ 客户原话 → 脱敏后引用:"客户询问..."而非"张总说..."
### 问答对的价值判断
提取的问答应该满足以下条件之一:
- **普遍性**:其他客户也可能遇到同类问题
- **典型性**:代表了某类法律场景的常见关切
- **教育性**:律师的解答有普法价值或指导意义
- **复用性**:可以独立成文或作为知识库条目
## 工作流程
### 步骤 1:分析输入内容
获取沟通记录文档和用户的具体要求,理解:
- 文档中的沟通内容和情境
- 用户希望重点关注哪些方面
- 哪些问答具有复用价值
### 步骤 2:识别有价值的问答对
**完整梳理文档中的问答内容**,按以下维度识别价值:
#### 问答识别维度
1. **直接问答** - 客户明确提出问题,律师给出解答
2. **追问回应** - 客户追问,律师进一步解释
3. **风险提醒** - 律师主动提醒的风险点及应对建议
4. **操作指引** - 涉及流程、步骤、注意事项的问答
5. **普遍关切** - 其他客户也可能遇到的同类问题
#### 问答提取方法
- **语义分析**:理解客户真实问题和律师核心观点
- **逻辑归纳**:将分散的对话整理为独立问答对
- **价值评估**:判断问答是否具有普遍适用性
- **标准化表述**:将口语化表达转化为规范的问答格式
### 步骤 3:生成结构化报告
输出文件保存至**原文档的同一目录**,文件命名:`{原文档名}_法律问答提取_{YYYYMMDD}.md`
**输出格式**详见 [output-template.md](references/output-template.md)。
每个问答对包含以下部分:
- **问题**:客户提出的问题(标准化表述)
- **律师解答**:律师的核心观点和建议(300-500字)
- **问题背景**(可选):该问题出现的情境(200-300字)
- **价值标签**:普遍性/典型性/教育性/复用性
- **适用场景**:什么情况下读者会关心这个问答
### 步骤 4:问答分类与关联
提供以下分析维度:
- **问答特征分析**:重点问答数量、常规问答数量、价值分布
- **领域分类**:按法律领域或业务场景分类
- **关联分析**:哪些问答之间存在关联、可组合成文章
## 质量标准
- **独立性**:每个问答对可以独立理解,不依赖完整对话背景
- **普遍性**:问答内容对其他客户也有参考价值
- **完整性**:问题和解答都清晰完整,没有断章取义
- **脱敏严格**:严格遵循客户信息保护规则
- **可复用**:提取的问答可以直接用于文章、知识库或学习材料
## 输入要求
本技能接受以下类型的输入:
1. **文档路径**:用户提供的沟通记录文档路径
2. **粘贴内容**:用户直接粘贴的沟通记录内容
3. **用户要求**:用户希望重点关注哪些类型的问答
## 适用场景
- 整理客户咨询记录为可复用知识
- 从对话中提取内容营销素材
- 建立法律问答知识库
- 准备普法文章的素材
- 制作客户常见问题清单
More from cat-xierluo/legal-skills
- clawhub-sync将本地开发的 Skills 批量同步到 ClawHub 平台。支持智能 .gitignore 过滤、白名单控制、增量同步、单个 skill 同步。本技能应在用户需要将本地 skills 发布到 ClawHub、批量同步技能、检查发布状态时使用。
- code2patent从已开发代码项目中提取技术实现证据,围绕候选专利方案生成技术交底书,并以“权利要求布局卡 → 发明专利初稿”两步法继续生成接近可申报版的中国发明专利起草材料。触发场景包括:读取代码仓库后撰写技术交底书、将人工总结的专利方案映射到具体实现、从代码中挖掘可专利技术方案、为专利代理师准备权利要求布局和发明专利初稿。
- course-generator从多个文献内容中系统化提取并生成结构化课程。支持 1-100+ 个文献文件,智能识别内容类型(转录/文献/混合),自动进行主题识别、课程大纲生成、总览与章节内容撰写。采用可选模块架构,适应不同类型内容(理论/实践/案例/历史等)。本技能应在用户需要将多个文献整理为系统化课程、生成学习材料、处理转录内容、或从复杂文稿中提取结构化内容时使用。
- court-sms本技能应在用户收到法院短信(文书送达、立案通知、开庭提醒等)时使用,自动提取案号、当事人、下载链接,下载文书并归档到对应案件目录。
- de-ai-polish检测并去除文章中的AI化表述模式,用于写作润色、文本优化、去AI腔。
- douyin-batch-download抖音视频批量下载工具 - 基于 F2 框架实现高效、增量的视频下载功能。支持单个/批量博主下载,自动 Cookie 管理,差量更新机制。本技能应在用户需要批量下载特定博主视频、服务器部署自动化下载、或定期更新视频库时使用。
- funasr-transcribe使用本地 FunASR 服务将音频或视频文件转录为带时间戳的 Markdown 文件,支持 mp4、mov、mp3、wav、m4a 等常见格式。本技能应在用户需要语音转文字、会议记录、视频字幕、播客转录时使用。
- git-batch-commit智能 Git 批量提交工具。当用户说 "git 提交"、"git commit"、"批量提交"、"拆分提交"、"整理提交" 时使用,或者当用户暂存了多个不同类型的文件需要分开提交时使用。自动将混合的文件修改按类型分类(依赖管理、文档更新、license 文件、配置、源代码等),并创建多个清晰聚焦的提交,使用标准化的提交信息格式。帮助保持清晰的 Git 历史,确保每个提交都有单一、明确的目的。使用英文前缀(docs:、feat:、fix: 等)加中文内容,支持 GitHub 彩色标签显示。
- github-star-managerGitHub Star 项目管理工具,支持从内容自动发现并 Star 项目,同步追踪更新,生成可视化 Dashboard
- legal-proposal-generator根据案件材料或沟通记录生成各类法律服务文档(诉讼方案、咨询报告、非诉方案、建议书、沟通报告、案件分析摘要等)。本技能应在用户需要将案件材料、咨询记录或沟通内容整理为专业法律文档时使用。