minimax-image-understand

$npx mdskill add cat-xierluo/legal-skills/minimax-image-understand

Analyze images using MiniMax MCP for OpenClaw agents.

  • Process visual content when users request image analysis or description.
  • Depends on MiniMax MCP service and Python 3.10+ environment.
  • Executes image understanding via configured API key and script.
  • Returns structured analysis results for agent workflows.

SKILL.md

.github/skills/minimax-image-understandView on GitHub ↗
---
name: minimax-image-understand
homepage: https://github.com/cat-xierluo/legal-skills
author: 杨卫薪律师(微信ywxlaw)
version: "0.1.0"
description: 通过 MiniMax MCP 进行图像理解,适用于 OpenClaw 平台。如果你是 Claude Code 用户,请忽略此技能。
license: MIT
---

# MiniMax MCP 图像理解

> **重要提示**:本技能适用于 **OpenClaw** 平台。如果你使用的是 **Claude Code**,请忽略此技能。

通过 MiniMax MCP 进行图像理解。

## 触发条件

用户发送图片并要求分析、描述、识别时使用。

## 依赖

### 系统依赖

| 依赖         | 安装方式                                                                  |
| ------------ | ------------------------------------------------------------------------- |
| Python 3.10+ | macOS:`brew install python3<br>`Linux: `sudo apt-get install python3` |

### Python 包

| 包名    | 用途         | 安装命令            |
| ------- | ------------ | ------------------- |
| `mcp` | MCP 客户端库 | `pip install mcp` |

## 前置要求

1. 安装依赖:`pip install mcp`
2. 配置环境变量:复制 `.env.example` 为 `.env` 并填入 API Key

## 使用方法

```bash
cd ~/.openclaw/skills/minimax-image-understand/scripts
source .env
python3 image_understand.py <图片路径或URL> [提示词]
```

## 代码中调用

```python
import sys
import os
sys.path.insert(0, "~/.openclaw/skills/minimax-image-understand/scripts")
os.environ["MINIMAX_API_KEY"] = "your-key"  # 或从 .env 加载
from image_understand import understand_image
result = await understand_image("image.jpg", "描述这张图片")
```

## 图片路径

图片保存位置:`~/.openclaw/media/inbound/`,文件名格式:`{uuid}.jpg`

## 配置文件

`.env` 文件已放在 `scripts/` 目录下,格式:

```
MINIMAX_API_KEY=your-api-key
```

More from cat-xierluo/legal-skills

SkillDescription
clawhub-sync将本地开发的 Skills 批量同步到 ClawHub 平台。支持智能 .gitignore 过滤、白名单控制、增量同步、单个 skill 同步。本技能应在用户需要将本地 skills 发布到 ClawHub、批量同步技能、检查发布状态时使用。
code2patent从已开发代码项目中提取技术实现证据,围绕候选专利方案生成技术交底书,并以“权利要求布局卡 → 发明专利初稿”两步法继续生成接近可申报版的中国发明专利起草材料。触发场景包括:读取代码仓库后撰写技术交底书、将人工总结的专利方案映射到具体实现、从代码中挖掘可专利技术方案、为专利代理师准备权利要求布局和发明专利初稿。
course-generator从多个文献内容中系统化提取并生成结构化课程。支持 1-100+ 个文献文件,智能识别内容类型(转录/文献/混合),自动进行主题识别、课程大纲生成、总览与章节内容撰写。采用可选模块架构,适应不同类型内容(理论/实践/案例/历史等)。本技能应在用户需要将多个文献整理为系统化课程、生成学习材料、处理转录内容、或从复杂文稿中提取结构化内容时使用。
court-sms本技能应在用户收到法院短信(文书送达、立案通知、开庭提醒等)时使用,自动提取案号、当事人、下载链接,下载文书并归档到对应案件目录。
de-ai-polish检测并去除文章中的AI化表述模式,用于写作润色、文本优化、去AI腔。
douyin-batch-download抖音视频批量下载工具 - 基于 F2 框架实现高效、增量的视频下载功能。支持单个/批量博主下载,自动 Cookie 管理,差量更新机制。本技能应在用户需要批量下载特定博主视频、服务器部署自动化下载、或定期更新视频库时使用。
funasr-transcribe使用本地 FunASR 服务将音频或视频文件转录为带时间戳的 Markdown 文件,支持 mp4、mov、mp3、wav、m4a 等常见格式。本技能应在用户需要语音转文字、会议记录、视频字幕、播客转录时使用。
git-batch-commit智能 Git 批量提交工具。当用户说 "git 提交"、"git commit"、"批量提交"、"拆分提交"、"整理提交" 时使用,或者当用户暂存了多个不同类型的文件需要分开提交时使用。自动将混合的文件修改按类型分类(依赖管理、文档更新、license 文件、配置、源代码等),并创建多个清晰聚焦的提交,使用标准化的提交信息格式。帮助保持清晰的 Git 历史,确保每个提交都有单一、明确的目的。使用英文前缀(docs:、feat:、fix: 等)加中文内容,支持 GitHub 彩色标签显示。
github-star-managerGitHub Star 项目管理工具,支持从内容自动发现并 Star 项目,同步追踪更新,生成可视化 Dashboard
legal-proposal-generator根据案件材料或沟通记录生成各类法律服务文档(诉讼方案、咨询报告、非诉方案、建议书、沟通报告、案件分析摘要等)。本技能应在用户需要将案件材料、咨询记录或沟通内容整理为专业法律文档时使用。