ollama
OfficielleApplication Docker from joly0's Repository
Vue d'ensemble
Exigences
Nvidia-Driver plugin (nVidia Support)
Radeon-TOP plugin (AMD Support)
Arguments d'exécution
- Interface utilisateur Web
http://[IP]:[PORT:11434]/- Réseau
bridge- Coquille
bash- Privilégié
- false
Configuration du modèle
- Cible
- /root/.ollama
- Défaut
- /mnt/user/appdata/ollama
- Valeur
- /mnt/user/appdata/ollama
Port number where ollama listens on.
- Cible
- 11434
- Défaut
- 11434
- Valeur
- 11434
IP and Port the server binds to. Set to 127.0.0.1:11434 for internal only access.
- Défaut
- 0.0.0.0:11434
- Valeur
- 0.0.0.0:11434
Comma-separated list of allowed CORS origins.
- Défaut
- *
- Valeur
- *
How long a model stays in VRAM, e.g. 60m or 24h (Set to -1 for infinite, 0 for none).
- Défaut
- 5m
- Valeur
- 5m
Timeout for stall detection during model loads.
- Défaut
- 5m
- Valeur
- 5m
Max number of parallel requests a single model can handle.
- Défaut
- 1
- Valeur
- 1
Default context window (tokens) if not specified by the model.
- Défaut
- 4096
- Valeur
- 4096
Quantization type for the K/V cache, e.g. f16, q8_0, q4_0.
- Défaut
- f16
- Valeur
- f16
The path where model weights and blobs are stored.
- Défaut
- /root/.ollama/models
- Valeur
- /root/.ollama/models
Maximum number of models loaded per GPU at once (Set to 0 for infinite).
- Défaut
- 0
- Valeur
- 0
Max requests that can wait in line when the server is busy.
- Défaut
- 512
- Valeur
- 512
Log detail level: 0 for INFO, 1 for DEBUG, 2 for TRACE.
- Défaut
- 0|1|2
Reserved VRAM (in bytes) to leave empty on each GPU.
- Défaut
- 0
- Valeur
- 0
Enables experimental Flash Attention optimizations.
- Défaut
- false|true
If true, always spreads model layers across all visible GPUs.
- Défaut
- false|true
Optimizes prompt caching when multiple users share a model.
- Défaut
- false|true
If true, does not delete unused model blobs on startup.
- Défaut
- false|true
Disables the readline history in the interactive CLI.
- Défaut
- false|true
Enables the experimental new Ollama engine.
- Défaut
- false|true
Enables experimental Vulkan hardware acceleration.
- Défaut
- false|true
Proxy for downloading models over HTTP.
Proxy for downloading models over HTTPS.
Comma-separate list of hosts/IPs that bypass the proxy.
Télécharger les statistiques
Total des téléchargements au fil du temps
Détails
ollama/ollamaExécutez Ollama sur Unraid.
Ollama est listé dans Community Apps pour Unraid OS. Explorez Unraid pour créer un serveur domestique flexible, un NAS ou un laboratoire domestique.