Le Model Context Protocol (MCP) a révolutionné la façon dont les agents IA interagissent avec des outils externes. Mais jusqu'à présent, il traînait un défaut majeur : la saturation de la fenêtre de contexte.
Anthropic vient de déployer une solution élégante avec MCP Tool Search.
Le problème : des outils qui dévorent votre contexte
Quand vous connectez un serveur MCP, toutes les définitions d'outils sont chargées en mémoire. Ça paraît anodin, jusqu'à ce que vous regardiez les chiffres.
Prenons GitHub MCP
91 outils différents, environ 46 000 tokens consommés.
C'est 22% de la fenêtre de contexte de Claude Opus — avant même d'avoir envoyé un seul message.
Multipliez ça par 5 ou 10 serveurs MCP connectés simultanément, et vous comprenez le problème. Votre agent IA passe plus de temps à gérer ses outils qu'à répondre à vos questions.
La solution : le chargement dynamique
MCP Tool Search change la donne avec une approche simple mais efficace : au lieu de tout charger d'entrée, Claude ne charge que l'outil de recherche. Quand il a besoin d'une fonctionnalité, il interroge le catalogue et charge uniquement les 3 à 5 outils pertinents.
Les gains sont significatifs
- ✓ Réduction jusqu'à 85% des tokens utilisés
- ✓ Activation automatique dès que les outils dépassent 10% du contexte
- ✓ Chargement de 3 à 5 outils à la demande
Vous développez des agents IA ?
Nos experts peuvent vous aider à optimiser votre architecture MCP pour des performances maximales.
Réserver une consultation gratuite →Deux modes de recherche
Anthropic propose deux approches selon vos besoins.
Regex (expressions régulières)
Claude écrit des patterns comme weather* ou get_*_data.
Idéal si vos outils suivent des conventions de nommage cohérentes.
BM25 (recherche par mots-clés)
Claude utilise des requêtes en langage naturel comme "outil pour la météo".
Plus adapté quand vos noms d'outils varient.
Comment implémenter Tool Search
Côté serveur : rendez vos outils trouvables
La clé, c'est l'optimisation des descriptions. Comparez :
❌ Avant
"Cet outil permet de récupérer les données météorologiques actuelles, les prévisions et l'historique météo pour n'importe quelle localisation dans le monde..."
✅ Après
"Météo actuelle, prévisions, historique. Keywords: fetch, weather, forecast, temperature"
Les bonnes pratiques :
- Commencez par la fonction principale
- Limitez-vous à 1-2 phrases
- Ajoutez des mots-clés recherchables (fetch, get, retrieve...)
- Mettez les contraintes dans le schéma, pas dans la description
Utilisez aussi les server instructions pour guider Claude sur l'ordre d'utilisation des outils : "Pour les opérations PR, d'abord vérifier le statut, puis voir ou approuver."
Côté client : 4 étapes d'implémentation
1. Activer la beta
Ajoutez le header requis à vos requêtes API.
2. Ajouter l'outil Tool Search
Choisissez entre regex ou BM25. Ne mettez jamais cet outil en chargement différé.
3. Marquer les outils pour chargement différé
Ajoutez deferred_loading: true aux outils non-essentiels.
4. Garder les outils essentiels chargés
Conservez 3 à 5 outils fréquemment utilisés sans chargement différé.
Quand utiliser Tool Search ?
✅ Utilisez-le si :
- • Vous avez 10+ outils MCP
- • Vos outils occupent plus de 10% du contexte
- • Vous connectez plusieurs serveurs MCP
❌ Évitez-le si :
- • Vous n'avez que 3 à 5 outils
- • Tous vos outils sont utilisés fréquemment
- • La latence est critique (la recherche ajoute un délai)
Les pièges à éviter
- ⚠️ Ne pas différer le chargement de Tool Search lui-même — ça annule tout l'intérêt
- ⚠️ Ne pas faire des descriptions trop courtes — "get_weather" est moins trouvable que "météo actuelle, prévisions, historique"
- ⚠️ Ne pas tout garder en chargement immédiat — si rien n'est différé, vous n'économisez rien
Ce que ça change concrètement
Pour les développeurs qui construisent des agents IA complexes, c'est une avancée majeure. Vous pouvez maintenant connecter des dizaines de serveurs MCP sans sacrifier la qualité des réponses.
La fenêtre de contexte redevient ce qu'elle devrait être : un espace dédié à la conversation et au raisonnement, pas un entrepôt de définitions d'outils.
MCP Tool Search est actuellement en beta. Pour l'activer, ajoutez le header approprié à vos requêtes API Anthropic.
Besoin d'aide pour optimiser vos agents IA ?
L'architecture MCP peut faire la différence entre un agent lent et un agent performant. Nos experts peuvent auditer et optimiser votre stack.