minimax-image-understand

Name: minimax-image-understand
Author: cat-xierluo/legal-skills

$npx mdskill add cat-xierluo/legal-skills/minimax-image-understand

Analyze images using MiniMax MCP for OpenClaw agents.

Process visual content when users request image analysis or description.
Depends on MiniMax MCP service and Python 3.10+ environment.
Executes image understanding via configured API key and script.
Returns structured analysis results for agent workflows.

SKILL.md

.github/skills/minimax-image-understandView on GitHub ↗

---
name: minimax-image-understand
homepage: https://github.com/cat-xierluo/legal-skills
author: 杨卫薪律师（微信ywxlaw）
version: "0.1.0"
description: 通过 MiniMax MCP 进行图像理解，适用于 OpenClaw 平台。如果你是 Claude Code 用户，请忽略此技能。
license: MIT
---

# MiniMax MCP 图像理解

> **重要提示**：本技能适用于 **OpenClaw** 平台。如果你使用的是 **Claude Code**，请忽略此技能。

通过 MiniMax MCP 进行图像理解。

## 触发条件

用户发送图片并要求分析、描述、识别时使用。

## 依赖

### 系统依赖

| 依赖         | 安装方式                                                                  |
| ------------ | ------------------------------------------------------------------------- |
| Python 3.10+ | macOS:`brew install python3<br>`Linux: `sudo apt-get install python3` |

### Python 包

| 包名    | 用途         | 安装命令            |
| ------- | ------------ | ------------------- |
| `mcp` | MCP 客户端库 | `pip install mcp` |

## 前置要求

1. 安装依赖：`pip install mcp`
2. 配置环境变量：复制 `.env.example` 为 `.env` 并填入 API Key

## 使用方法

```bash
cd ~/.openclaw/skills/minimax-image-understand/scripts
source .env
python3 image_understand.py <图片路径或URL> [提示词]
```

## 代码中调用

```python
import sys
import os
sys.path.insert(0, "~/.openclaw/skills/minimax-image-understand/scripts")
os.environ["MINIMAX_API_KEY"] = "your-key"  # 或从 .env 加载
from image_understand import understand_image
result = await understand_image("image.jpg", "描述这张图片")
```

## 图片路径

图片保存位置：`~/.openclaw/media/inbound/`，文件名格式：`{uuid}.jpg`

## 配置文件

`.env` 文件已放在 `scripts/` 目录下，格式：

```
MINIMAX_API_KEY=your-api-key
```

More from cat-xierluo/legal-skills

Skill	Description
clawhub-sync	将本地开发的 Skills 批量同步到 ClawHub 平台。支持智能 .gitignore 过滤、白名单控制、增量同步、单个 skill 同步。本技能应在用户需要将本地 skills 发布到 ClawHub、批量同步技能、检查发布状态时使用。
code2patent	从已开发代码项目中提取技术实现证据，围绕候选专利方案生成技术交底书，并以“权利要求布局卡 → 发明专利初稿”两步法继续生成接近可申报版的中国发明专利起草材料。触发场景包括：读取代码仓库后撰写技术交底书、将人工总结的专利方案映射到具体实现、从代码中挖掘可专利技术方案、为专利代理师准备权利要求布局和发明专利初稿。
course-generator	从多个文献内容中系统化提取并生成结构化课程。支持 1-100+ 个文献文件，智能识别内容类型（转录/文献/混合），自动进行主题识别、课程大纲生成、总览与章节内容撰写。采用可选模块架构，适应不同类型内容（理论/实践/案例/历史等）。本技能应在用户需要将多个文献整理为系统化课程、生成学习材料、处理转录内容、或从复杂文稿中提取结构化内容时使用。
court-sms	本技能应在用户收到法院短信（文书送达、立案通知、开庭提醒等）时使用，自动提取案号、当事人、下载链接，下载文书并归档到对应案件目录。
de-ai-polish	检测并去除文章中的AI化表述模式，用于写作润色、文本优化、去AI腔。
douyin-batch-download	抖音视频批量下载工具 - 基于 F2 框架实现高效、增量的视频下载功能。支持单个/批量博主下载，自动 Cookie 管理，差量更新机制。本技能应在用户需要批量下载特定博主视频、服务器部署自动化下载、或定期更新视频库时使用。
funasr-transcribe	使用本地 FunASR 服务将音频或视频文件转录为带时间戳的 Markdown 文件，支持 mp4、mov、mp3、wav、m4a 等常见格式。本技能应在用户需要语音转文字、会议记录、视频字幕、播客转录时使用。
git-batch-commit	智能 Git 批量提交工具。当用户说 "git 提交"、"git commit"、"批量提交"、"拆分提交"、"整理提交" 时使用，或者当用户暂存了多个不同类型的文件需要分开提交时使用。自动将混合的文件修改按类型分类（依赖管理、文档更新、license 文件、配置、源代码等），并创建多个清晰聚焦的提交，使用标准化的提交信息格式。帮助保持清晰的 Git 历史，确保每个提交都有单一、明确的目的。使用英文前缀（docs:、feat:、fix: 等）加中文内容，支持 GitHub 彩色标签显示。
github-star-manager	GitHub Star 项目管理工具，支持从内容自动发现并 Star 项目，同步追踪更新，生成可视化 Dashboard
legal-proposal-generator	根据案件材料或沟通记录生成各类法律服务文档（诉讼方案、咨询报告、非诉方案、建议书、沟通报告、案件分析摘要等）。本技能应在用户需要将案件材料、咨询记录或沟通内容整理为专业法律文档时使用。