Étiquette

Étiquette : self-hosting

Intelligence Artificielle

Continue.dev : un assistant IA dans VSCode branché sur vos modèles

Continue.dev amène vos modèles auto-hébergés (Ollama, vLLM) dans VSCode et JetBrains : chat, édition inline et autocomplétion FIM, sans envoyer votre code au cloud.

juin 19, 202611 min de lecture

Intelligence Artificielle

OpenWebUI : une interface de chat self-hosted pour vos modèles

OpenWebUI offre une interface type ChatGPT, auto-hébergée et hors-ligne, par-dessus Ollama, vLLM ou LiteLLM. Installation Docker, multi-utilisateurs et RAG documentaire.

juin 19, 202612 min de lecture

Intelligence Artificielle

LiteLLM : unifier toutes vos API LLM derrière un seul endpoint

Une passerelle compatible OpenAI devant tous vos modèles : Ollama, vLLM, Claude, Gemini. Clés virtuelles, budgets et répartition de charge avec le proxy LiteLLM.

juin 19, 202612 min de lecture

Intelligence Artificielle

vLLM : serveur d’inférence haute performance sur GPU

vLLM sert vos LLM open-source en production : batching continu, PagedAttention, parallélisme multi-GPU et API compatible OpenAI. Quand et comment l'utiliser après Ollama.

juin 18, 202612 min de lecture

Intelligence Artificielle

Ollama avancé : modèles quantifiés, Modelfile et fine-tuning local

Au-delà de l'installation : comprendre la quantification GGUF (Q4_K_M), personnaliser un modèle avec un Modelfile, et importer un fine-tuning LoRA local dans Ollama.

juin 18, 202611 min de lecture

Intelligence Artificielle

Héberger ses LLM soi-même en 2026 : Ollama, vLLM, LiteLLM, OpenWebUI

La stack LLM self-hosted de 2026 : moteur d'inférence (Ollama, vLLM), proxy LiteLLM, interface OpenWebUI et assistant code Continue.dev. Souveraineté des données, coût et indépendance pour l'Afrique de…

juin 18, 202616 min de lecture