legal-qa-extractor

Name: legal-qa-extractor
Author: cat-xierluo/legal-skills

$npx mdskill add cat-xierluo/legal-skills/legal-qa-extractor

Extract reusable legal Q&A pairs from client records to build structured knowledge bases.

Organize client consultations, build FAQs, or create marketing content from dialogue.
Requires only input text documents containing lawyer-client communications.
Analyzes dialogue for universal, typical, or educational legal insights.
Outputs a structured Markdown file containing question, answer, and context.

SKILL.md

.github/skills/legal-qa-extractorView on GitHub ↗

---
name: legal-qa-extractor
homepage: https://github.com/cat-xierluo/legal-skills
author: 杨卫薪律师（微信ywxlaw）
version: "1.0.0"
license: CC-BY-NC-SA-4.0
description: 从律师与客户沟通记录中提取有价值的法律问答对，生成结构化知识库内容。本技能应在用户需要整理客户咨询记录、从对话中提取可复用法律知识、创建问答知识库、或准备内容营销素材时使用。支持严格客户信息脱敏处理。
---

# 法律问答提取技能

## 概述

从律师与客户的沟通记录中提取有价值的**法律问答对**（客户问题 + 律师解答），生成结构化知识库内容。适用于将客户咨询转化为可复用的法律知识，供后续整理成文章、案例或学习材料。

**核心价值**：提取那些可以被其他客户复用的问答内容，而不是单一客户的具体案情。

## 核心原则

### 客户信息保护

**绝对禁止**在问答内容中包含：
- ❌ 客户真实姓名
- ❌ 企业/机构名称
- ❌ 具体地址、联系方式
- ❌ 任何可识别个人或企业的信息

**脱敏处理标准**：
- ✅ 客户姓名 → 使用"当事人"、"客户"、"甲/乙"等代称
- ✅ 企业名称 → 使用"某公司"、"某企业"、"该企业"等代称
- ✅ 具体信息 → 模糊化为"某地"、"某时间"、"相关人员"等
- ✅ 客户原话 → 脱敏后引用："客户询问..."而非"张总说..."

### 问答对的价值判断

提取的问答应该满足以下条件之一：
- **普遍性**：其他客户也可能遇到同类问题
- **典型性**：代表了某类法律场景的常见关切
- **教育性**：律师的解答有普法价值或指导意义
- **复用性**：可以独立成文或作为知识库条目

## 工作流程

### 步骤 1：分析输入内容

获取沟通记录文档和用户的具体要求，理解：
- 文档中的沟通内容和情境
- 用户希望重点关注哪些方面
- 哪些问答具有复用价值

### 步骤 2：识别有价值的问答对

**完整梳理文档中的问答内容**，按以下维度识别价值：

#### 问答识别维度

1. **直接问答** - 客户明确提出问题，律师给出解答
2. **追问回应** - 客户追问，律师进一步解释
3. **风险提醒** - 律师主动提醒的风险点及应对建议
4. **操作指引** - 涉及流程、步骤、注意事项的问答
5. **普遍关切** - 其他客户也可能遇到的同类问题

#### 问答提取方法

- **语义分析**：理解客户真实问题和律师核心观点
- **逻辑归纳**：将分散的对话整理为独立问答对
- **价值评估**：判断问答是否具有普遍适用性
- **标准化表述**：将口语化表达转化为规范的问答格式

### 步骤 3：生成结构化报告

输出文件保存至**原文档的同一目录**，文件命名：`{原文档名}_法律问答提取_{YYYYMMDD}.md`

**输出格式**详见 [output-template.md](references/output-template.md)。

每个问答对包含以下部分：

- **问题**：客户提出的问题（标准化表述）
- **律师解答**：律师的核心观点和建议（300-500字）
- **问题背景**（可选）：该问题出现的情境（200-300字）
- **价值标签**：普遍性/典型性/教育性/复用性
- **适用场景**：什么情况下读者会关心这个问答

### 步骤 4：问答分类与关联

提供以下分析维度：

- **问答特征分析**：重点问答数量、常规问答数量、价值分布
- **领域分类**：按法律领域或业务场景分类
- **关联分析**：哪些问答之间存在关联、可组合成文章

## 质量标准

- **独立性**：每个问答对可以独立理解，不依赖完整对话背景
- **普遍性**：问答内容对其他客户也有参考价值
- **完整性**：问题和解答都清晰完整，没有断章取义
- **脱敏严格**：严格遵循客户信息保护规则
- **可复用**：提取的问答可以直接用于文章、知识库或学习材料

## 输入要求

本技能接受以下类型的输入：

1. **文档路径**：用户提供的沟通记录文档路径
2. **粘贴内容**：用户直接粘贴的沟通记录内容
3. **用户要求**：用户希望重点关注哪些类型的问答

## 适用场景

- 整理客户咨询记录为可复用知识
- 从对话中提取内容营销素材
- 建立法律问答知识库
- 准备普法文章的素材
- 制作客户常见问题清单