keyword-clusterer

$npx mdskill add guia-matthieu/clawfu-skills/keyword-clusterer

Groups keywords by semantic similarity and intent for content planning and SEO strategy.

  • Helps organize keyword research, create content pillars, and identify gaps in site structure.
  • Depends on scikit-learn, sentence-transformers, pandas, and click for clustering and data handling.
  • Uses embeddings to analyze semantic similarity and categorize keywords based on search intent.
  • Presents results through structured outputs like topic clusters and strategic recommendations.

SKILL.md

.github/skills/keyword-clustererView on GitHub ↗
---
name: keyword-clusterer
description: "Cluster keywords by semantic similarity and intent. Use when: organizing keyword research; creating content pillars; mapping keywords to pages; identifying content gaps; grouping search intent"
license: MIT
metadata:
  author: ClawFu
  version: 1.0.0
  mcp-server: "@clawfu/mcp-skills"
---

# Keyword Clusterer

> Group keywords by semantic similarity using embeddings - turn a keyword list into an organized content strategy.

## When to Use This Skill

- **Content planning** - Group keywords into topic clusters
- **Site structure** - Map keywords to pages
- **Intent analysis** - Categorize by search intent
- **Gap analysis** - Find missing keyword themes
- **PPC organization** - Group keywords for ad groups


## What Claude Does vs What You Decide

| Claude Does | You Decide |
|-------------|------------|
| Structures analysis frameworks | Strategic priorities |
| Synthesizes market data | Competitive positioning |
| Identifies opportunities | Resource allocation |
| Creates strategic options | Final strategy selection |
| Suggests implementation approaches | Execution decisions |

## Dependencies

```bash
pip install scikit-learn sentence-transformers pandas click
# For simpler usage without ML:
pip install click pandas
```

## Commands

### Cluster Keywords
```bash
python scripts/main.py cluster keywords.csv --n-clusters 10
python scripts/main.py cluster keywords.csv --column keyword --n-clusters 15
```

### Find Similar
```bash
python scripts/main.py similar "content marketing" --count 20
```

### Analyze Intent
```bash
python scripts/main.py intent keywords.csv --column keyword
```

## Examples

### Example 1: Cluster Keyword Research
```bash
# Input: keywords.csv with 500 keywords
python scripts/main.py cluster keywords.csv --n-clusters 12 --output clustered.csv

# Output:
# Cluster 1 (45 keywords): "content marketing"
#   - content marketing strategy
#   - content marketing tips
#   - how to do content marketing
#
# Cluster 2 (38 keywords): "email marketing"
#   - email marketing tools
#   - best email marketing software
#   - email campaign tips
# ...
```

### Example 2: Categorize by Intent
```bash
python scripts/main.py intent keywords.csv --column keyword

# Output:
# Intent Analysis
# ──────────────────────
# Informational: 234 (47%)
#   - how to, what is, guide, tips
# Commercial: 156 (31%)
#   - best, top, review, compare
# Transactional: 78 (16%)
#   - buy, price, discount, order
# Navigational: 32 (6%)
#   - login, contact, brand names
```

## Search Intent Categories

| Intent | Signals | Content Type |
|--------|---------|--------------|
| **Informational** | how, what, why, guide | Blog posts, guides |
| **Commercial** | best, top, review, vs | Comparisons, reviews |
| **Transactional** | buy, price, discount | Product pages |
| **Navigational** | [brand], login, contact | Landing pages |

## Clustering Methods

| Method | Best For | Speed |
|--------|----------|-------|
| **semantic** | Meaning-based grouping | Slower |
| **lexical** | Word overlap grouping | Faster |
| **intent** | Search intent categories | Fast |

## Skill Boundaries

### What This Skill Does Well
- Structuring strategic analysis
- Identifying market opportunities
- Creating strategic frameworks
- Synthesizing competitive data

### What This Skill Cannot Do
- Replace market research
- Guarantee strategic success
- Know proprietary competitor info
- Make executive decisions

## Related Skills

- [content-repurposer](../../automation/content-repurposer/) - Create content for clusters
- [lighthouse-audit](../lighthouse-audit/) - Optimize cluster pages

## Skill Metadata


- **Mode**: centaur
```yaml
category: seo-tools
subcategory: keyword-research
dependencies: [scikit-learn, sentence-transformers, pandas]
difficulty: intermediate
time_saved: 5+ hours/week
```

More from guia-matthieu/clawfu-skills

SkillDescription
aarrr-metricsMeasure and optimize growth using the AARRR (Pirate Metrics) framework with stage-specific KPIs and funnel analysis
ab-test-stats"Calculate A/B test statistical significance. Use when: determining if test results are significant; calculating required sample size; estimating test duration; analyzing conversion experiments; making data-driven decisions"
account-healthAssess customer account health using product usage, support sentiment, payment status, and relationship signals
ad-spend-optimizer"Analyze paid advertising performance across channels and recommend budget reallocation to maximize ROAS and minimize CAC. Use when: planning quarterly ad budget allocation, diagnosing underperforming ad channels, deciding whether to scale spend on a channel, calculating marginal ROI across Google Ads, Meta, LinkedIn, or TikTok, rebalancing media mix after performance shifts, or setting up a test-and-scale framework for new channels."
ai-bot-log-auditUse when analyzing server logs to understand how AI crawlers (GPTBot, ClaudeBot, PerplexityBot) interact with your site. Use when optimizing content placement for LLM retrieval, diagnosing why AI search isn't citing your content, or auditing crawl patterns to find optimization gaps.
ai-storyboard-2x2"Créez des storyboards visuellement cohérents en utilisant la technique des 2x2 Grid Shots de PJ Ace, garantissant éclairage, personnages et décors uniformes entre les plans. Use when: **Après avoir finalisé un script vidéo** - Transformer le concept en visuels; **Besoin de cohérence visuelle** - Personnages et éclairage constants entre les plans; **Préparer des assets pour animation** - Frames prêtes pour Veo, Runway, Kling; **Présenter un storyboard client** - Visualisation avant production;..."
ai-video-concept"Développez une idée créative et structurez un script vidéo optimisé pour la génération IA, en suivant la méthode des scènes de 8 secondes de PJ Ace. Use when: **Démarrer une publicité vidéo IA** - Transformer une idée brute en script structuré; **Créer du contenu vidéo pour les réseaux sociaux** - TikTok, Reels, YouTube Shorts; **Développer un concept de campagne** - Avant de passer au storyboard; **Pitcher une idée vidéo** - Présenter un concept à un client ou une équipe; **Adapter un messag..."
ai-video-prompting"Générez des prompts optimisés pour chaque modèle de génération vidéo IA (Veo 3, Runway Gen-3, Kling 2.6, Pika), en exploitant leurs forces spécifiques. Use when: **Animer des frames de storyboard** - Transformer des images fixes en vidéo; **Choisir le bon modèle** - Sélectionner Veo, Runway, Kling ou Pika selon le besoin; **Optimiser la qualité de génération** - Prompts structurés pour meilleurs résultats; **Créer des transitions fluides** - Scene extension, first/last frame; **Utiliser le mo..."
ai-video-qa"Validez la qualité de vos vidéos IA avant publication avec une checklist complète couvrant technique, créatif, et positionnement marque. Use when: **Avant publication** - Dernière validation avant mise en ligne; **Revue client** - Préparer les points de feedback anticipés; **Itération qualité** - Identifier les problèmes à corriger; **Go/No-Go decision** - Décider si la vidéo est prête; **Post-mortem** - Analyser pourquoi une vidéo a (ou n'a pas) performé"
ai-voice-design"Concevez et générez des voix IA pour vos vidéos en utilisant ElevenLabs ou Qwen3-TTS, avec clonage vocal, design par description, et synchronisation lip-sync. Use when: **Créer une voix de marque** - Définir le ton vocal pour une campagne; **Cloner une voix existante** - Reproduire une voix avec autorisation; **Designer une voix originale** - Créer une voix à partir d'une description; **Multi-personnages** - Gérer plusieurs voix dans une même vidéo; **Lip-sync vidéo IA** - Synchroniser voix e..."