—tools/helicone.json
Helicone
Observabilité LLM par proxy : tu changes 1 ligne, tu vois tous tes calls. Cache LLM intégré pour réduire la facture.
01—à savoir
Approche différente de Langfuse : tu changes l'URL de base de tes calls OpenAI/Anthropic vers Helicone (ou tu installes leur SDK), et instantanément tu as la visibilité sur tous tes appels — sans refactor. Bonus : cache HTTP intelligent qui peut te faire économiser ~30% de tokens sur du RAG répétitif. Plus simple à intégrer que Langfuse mais moins de features eval / dataset.
02—pros
- Setup en 1 ligne : tu changes l'URL de base, c'est tout
- Cache LLM intelligent — économise ~30% de tokens sur RAG répétitif
- Free tier 100K req/mois généreux
- Open-source, self-host possible
- Compatible tous les providers OpenAI-API-like (OpenAI, Anthropic, Mistral, Groq…)
03—cons
- Moins de features eval/dataset que Langfuse
- Le proxy ajoute ~50ms de latence (négligeable mais réel)
- Tracing moins fin sur les agents multi-step que Langfuse
—alternatives
—paire bien avec
- Anthropic APIL'API derrière Claude. Modèles Sonnet/Opus/Haiku, prompt caching, tool use, files, agents managés.
- OpenAI APIL'API GPT-5/4o/o3. Référence concurrente d'Anthropic, ecosystème historique, image gen + voice + audio natifs.
- Mistral AIL'API LLM française. Souveraineté UE, modèles open-weight + closed, prix imbattables sur les modèles small.
- GroqInference LLM ultra-rapide (~500 tok/s). Free tier généreux, idéal pour latence critique et prototyping.
// à explorer ensuite
À explorer ensuite
Suggestions calculées sémantiquement — proches de ce que tu lis, pas seulement par catégorie.
- outil
Langfuse
Observabilité open-source pour apps LLM. Traces, prompts, eval, A/B testing — self-host gratuit ou cloud managé.
- outil
OpenClaw
Assistant IA personnel open-source local-first. Tu choisis le LLM, ton ordi tourne, tes données restent chez toi.
- outil
OpenWebUI
L'interface ChatGPT-like que tu self-host. Branche Ollama, Claude, GPT — RAG, plugins, multi-user, tout en local.
- outil
Anthropic API
L'API derrière Claude. Modèles Sonnet/Opus/Haiku, prompt caching, tool use, files, agents managés.