Ollama Installation und Dokumentation

Dieses Repository enthält Scripts und Konfigurationsdateien, um Ollama mit GPU-Unterstützung auf der ICC der HAW Hamburg zu deployen. Zusätzlich wird ein Ollama WebUI als Benutzeroberfläche bereitgestellt sowie Funktionen zur Anpassung der Modelle an spezifische Anwendungsfälle.

Voraussetzungen

HAW Hamburg infw-Account mit Zugang zur ICC
kubectl installiert
(Optional) Terraform installiert (Nur für das lokale WebUI-Deployment)
Eine aktive VPN-Verbindung zum HAW-Netz (wenn außerhalb des HAW-Netzes)
(Optional) Make installiert für vereinfachte Befehle
(Optional) IntelliJ IDEA für die erweiterte IDE-Integration

ICC-Zugang einrichten

Bevor Sie beginnen können, müssen Sie sich bei der ICC anmelden und Ihre Kubeconfig-Datei einrichten. Dazu stellen wir ein Hilfsskript bereit:

# Öffnet den Browser mit der ICC-Login-Seite und führt Sie durch die Einrichtung
./scripts/icc-login.sh

Dieses Skript führt Sie durch den gesamten Prozess:

Öffnet die ICC-Login-Seite in Ihrem Standard-Browser
Führt Sie durch den Anmeldeprozess mit Ihrer infw-Kennung
Hilft beim Speichern und Einrichten der heruntergeladenen Kubeconfig-Datei
Testet die Verbindung und zeigt Ihre Namespace-Informationen an

Alternativ können Sie die manuelle Einrichtung durchführen.

Schnellstart

# Repository klonen
git clone <repository-url>
cd icc-ollama-deployment

# ICC-Zugang einrichten (falls noch nicht geschehen)
./scripts/icc-login.sh

# Konfiguration anpassen
cp configs/config.example.sh configs/config.sh
vim configs/config.sh  # Passen Sie Ihre Namespace-Informationen an

# Ausführungsberechtigungen für Skripte setzen
./scripts/set-permissions.sh

# Deployment ausführen
./deploy.sh

Oder mit Make:

make deploy

Detaillierte Anleitung

Eine ausführliche Schritt-für-Schritt-Anleitung finden Sie in der DOCUMENTATION.md Datei.

GPU-Ressourcen skalieren

Um die Performance zu optimieren oder größere Modelle zu unterstützen, können Sie die Anzahl der GPUs dynamisch anpassen:

# Skalieren auf 2 GPUs für verbesserte Performance
./scripts/scale-gpu.sh --count 2

# Reduzieren auf 1 GPU, wenn nicht alle Ressourcen benötigt werden
./scripts/scale-gpu.sh --count 1

Weitere Details zur GPU-Skalierung finden Sie in der ausführlichen Dokumentation.

GPU-Testen und Überwachen

Das Projekt enthält verschiedene Skripte zum Testen, Überwachen und Benchmarken der GPU-Funktionalität:

GPU-Funktionalität testen

Überprüfen Sie, ob die GPU korrekt eingerichtet ist und von Ollama genutzt wird:

./scripts/test-gpu.sh
# oder
make gpu-test

GPU-Auslastung überwachen

Überwachen Sie die GPU-Auslastung in Echtzeit:

./scripts/monitor-gpu.sh
# oder
make gpu-monitor

Mit Optionen für kontinuierliche Überwachung:

# 10 Messungen im 5-Sekunden-Intervall
./scripts/monitor-gpu.sh -i 5

GPU-Benchmarks durchführen

Führen Sie Leistungstests für ein spezifisches Modell durch:

./scripts/benchmark-gpu.sh llama3:8b
# oder
make gpu-bench MODEL=llama3:8b

GPU-Kompatibilität prüfen

Überprüfen Sie die vollständige GPU-Konfiguration und -Kompatibilität:

./scripts/check-gpu-compatibility.sh
# oder
make gpu-compat

Architektur

Einen Überblick über die Systemarchitektur und die Komponenten des Projekts finden Sie in der ARCHITECTURE.md Datei.

Troubleshooting

Bei Problemen mit der GPU-Funktionalität oder Modellanpassung können folgende Schritte helfen:

Überprüfen Sie die GPU-Kompatibilität: make gpu-compat
Testen Sie die GPU-Funktionalität: make gpu-test
Überprüfen Sie die Deployment-Konfiguration: kubectl -n $NAMESPACE get deployment $OLLAMA_DEPLOYMENT_NAME -o yaml
Prüfen Sie die Logs des Ollama-Pods: make logs
Öffnen Sie eine Shell im Pod: make shell

Weitere Informationen zur Fehlerbehebung finden Sie in der DOCUMENTATION.md.

Wartung

Die Funktionen für GPU-Tests, Monitoring und Modellanpassung ermöglichen ein kontinuierliches Management Ihrer Ollama-Instanz, um sicherzustellen, dass sie optimal mit den verfügbaren Ressourcen arbeitet und an Ihre spezifischen Anforderungen angepasst ist.

Name		Name	Last commit message	Last commit date
Latest commit History 92 Commits
.idea		.idea
configs		configs
examples		examples
rag		rag
scripts		scripts
templates		templates
terraform		terraform
.gitignore		.gitignore
ARCHITECTURE.md		ARCHITECTURE.md
DEFAULT-README.md		DEFAULT-README.md
DOCUMENTATION.md		DOCUMENTATION.md
LICENSE		LICENSE
Makefile		Makefile
RAG-README.md		RAG-README.md
README.md		README.md
deploy.sh		deploy.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Ollama Installation und Dokumentation

Inhaltsverzeichnis

Voraussetzungen

ICC-Zugang einrichten

Schnellstart

Detaillierte Anleitung

GPU-Ressourcen skalieren

GPU-Testen und Überwachen

GPU-Funktionalität testen

GPU-Auslastung überwachen

GPU-Benchmarks durchführen

GPU-Kompatibilität prüfen

Architektur

Troubleshooting

Wartung

About

Uh oh!

Releases 1

Packages

Uh oh!

Languages

License

scimbe/icc-ollama-deployment

Folders and files

Latest commit

History

Repository files navigation

Ollama Installation und Dokumentation

Inhaltsverzeichnis

Voraussetzungen

ICC-Zugang einrichten

Schnellstart

Detaillierte Anleitung

GPU-Ressourcen skalieren

GPU-Testen und Überwachen

GPU-Funktionalität testen

GPU-Auslastung überwachen

GPU-Benchmarks durchführen

GPU-Kompatibilität prüfen

Architektur

Troubleshooting

Wartung

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Languages

Packages