mercredi 7 janvier 2026

Ollama  CUDA  Sur  Solus

1️⃣ Installer le pilote NVIDIA


# Mettre à jour les dépôts

sudo eopkg update


# Installer le pilote propriétaire (exemple : version actuelle)

sudo eopkg install nvidia-current nvidia-current-glx   # ou le paquet correspondant à votre carte

# (ajoutez le paquet 32‑bits si vous utilisez Steam/Wine : nvidia-current-32bit) 

Redémarrez, puis vérifiez : nvidia-smi. Si la commande affiche votre GPU, le pilote fonctionne correctement


2️⃣ CUDA : Solus ne le fournit pas directement

Solus ne propose pas le toolkit CUDA à cause des licences NVIDIA hostkey.com. Vous avez deux options :


Installer le toolkit depuis le site NVIDIA


Téléchargez le fichier .run correspondant à votre version de driver (ex. CUDA 12.x).

Passez en console texte (Ctrl+Alt+F3), arrêtez le serveur graphique (sudo systemctl isolate multi-user.target).

Exécutez : sudo sh cuda_<version>_linux.run et suivez les instructions (ne réinstallez pas le driver si déjà présent).

Ajoutez les bibliothèques :

echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.profile

echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.profile

source ~/.profile

Vérifiez : nvcc --version et nvidia-smi (les deux doivent fonctionner).

Utiliser Docker avec nvidia‑docker (plus simple, évite les conflits) :


sudo eopkg install nvidia-docker   # paquet fourni par Solus

docker run --gpus all -it ollama/ollama bash

Le conteneur possède déjà CUDA et le serveur Ollama peut être lancé à l’intérieur.


3️⃣ Installer Ollama


curl -fsSL https://ollama.com/install.sh | sh

# ou téléchargez le .tar.gz depuis https://ollama.com/download

Le service systemd ollama.service est créé automatiquement.


4️⃣ Activer l’accélération GPU dans Ollama


Éditez le service :


sudo systemctl edit ollama.service

Ajoutez :


[Service]

Environment="OLLAMA_NUM_GPU=-1"          # utilise tout le GPU

Environment="OLLAMA_FLASH_ATTENTION=1"   # améliore les performances

Rechargez et redémarrez :


sudo systemctl daemon-reload

sudo systemctl restart ollama.service

5️⃣ Tester


ollama run llama2   # ou tout autre modèle disponible

Dans la sortie, la colonne Processor doit indiquer « 100 % GPU » si l’accélération fonctionne


6️⃣ Dépannage rapide


Symptom Vérification

nvidia-smi échoue Le pilote n’est pas chargé ; réinstallez le paquet nvidia-* et redémarrez.

Ollama reste sur CPU Confirmez que les variables OLLAMA_NUM_GPU et OLLAMA_FLASH_ATTENTION sont bien dans le service ; relancez le service.

ollama run signale « CUDA not found » Assurez‑vous que le toolkit CUDA est dans LD_LIBRARY_PATH (ou utilisez le conteneur Docker).

Conflit de versions driver / CUDA Installez une version de CUDA compatible avec le driver affiché par nvidia-smi (ex. driver 535 ↔ CUDA 12.2).

En résumé : installez le pilote NVIDIA via eopkg, obtenez CUDA soit avec le .run officiel soit via le conteneur Docker, installez Ollama, puis activez les variables d’environnement OLLAMA_NUM_GPU=-1 (et éventuellement OLLAMA_FLASH_ATTENTION=1). Vous pourrez alors lancer vos modèles LLM directement sur le GPU sous Solus.


Bonne configuration !

Aucun commentaire:

Publier un commentaire

Ollama  CUDA  Sur  Solus

1️⃣ Installer le pilote NVIDIA # Mettre à jour les dépôts sudo eopkg update # Installer le pilote propriétaire (exemple : version actuelle) ...