ollama
OficialAplicación Docker from joly0's Repository
Visión general
Requisitos
Nvidia-Driver plugin (nVidia Support)
Radeon-TOP plugin (AMD Support)
Argumentos en tiempo de ejecución
- Interfaz web
http://[IP]:[PORT:11434]/- Red
bridge- Concha
bash- Privilegiado
- false
Configuración de plantillas
- Objetivo
- /root/.ollama
- Por defecto
- /mnt/user/appdata/ollama
- Valor
- /mnt/user/appdata/ollama
Port number where ollama listens on.
- Objetivo
- 11434
- Por defecto
- 11434
- Valor
- 11434
IP and Port the server binds to. Set to 127.0.0.1:11434 for internal only access.
- Por defecto
- 0.0.0.0:11434
- Valor
- 0.0.0.0:11434
Comma-separated list of allowed CORS origins.
- Por defecto
- *
- Valor
- *
How long a model stays in VRAM, e.g. 60m or 24h (Set to -1 for infinite, 0 for none).
- Por defecto
- 5m
- Valor
- 5m
Timeout for stall detection during model loads.
- Por defecto
- 5m
- Valor
- 5m
Max number of parallel requests a single model can handle.
- Por defecto
- 1
- Valor
- 1
Default context window (tokens) if not specified by the model.
- Por defecto
- 4096
- Valor
- 4096
Quantization type for the K/V cache, e.g. f16, q8_0, q4_0.
- Por defecto
- f16
- Valor
- f16
The path where model weights and blobs are stored.
- Por defecto
- /root/.ollama/models
- Valor
- /root/.ollama/models
Maximum number of models loaded per GPU at once (Set to 0 for infinite).
- Por defecto
- 0
- Valor
- 0
Max requests that can wait in line when the server is busy.
- Por defecto
- 512
- Valor
- 512
Log detail level: 0 for INFO, 1 for DEBUG, 2 for TRACE.
- Por defecto
- 0|1|2
Reserved VRAM (in bytes) to leave empty on each GPU.
- Por defecto
- 0
- Valor
- 0
Enables experimental Flash Attention optimizations.
- Por defecto
- false|true
If true, always spreads model layers across all visible GPUs.
- Por defecto
- false|true
Optimizes prompt caching when multiple users share a model.
- Por defecto
- false|true
If true, does not delete unused model blobs on startup.
- Por defecto
- false|true
Disables the readline history in the interactive CLI.
- Por defecto
- false|true
Enables the experimental new Ollama engine.
- Por defecto
- false|true
Enables experimental Vulkan hardware acceleration.
- Por defecto
- false|true
Proxy for downloading models over HTTP.
Proxy for downloading models over HTTPS.
Comma-separate list of hosts/IPs that bypass the proxy.
Descargar estadísticas
Descargas totales a lo largo del tiempo
Enlaces
Detalles
ollama/ollamaEjecute Ollama en Unraid.
Ollama se encuentra en Community Apps para Unraid OS. Explore Unraid para crear un servidor doméstico flexible, un NAS o un laboratorio doméstico.