ohara Blog

Neuigkeiten

Aktuelles aus der Praxis — LLMOps, Routing, Kostenoptimierung und mehr.

llmops

LLM Routing in der Praxis — wie man Modelle automatisch wählt

Classifier-basiertes Routing, regelbasierte Fallbacks und hybride Ansätze: Wie du mit Model Prism das richtige Modell für jede Anfrage auswählst und dabei Kosten und Qualität im Gleichgewicht hältst.

Weiterlesen
agents

Eigene Sub-Agenten bauen — Designmuster für KI-gestützte Workflows

Designmuster für spezialisierte Sub-Agenten mit engem Scope, expliziten Kontrakten und komposierbare Pipelines für KI-gestützte Entwicklung.

Weiterlesen
cost

Kostenlose KI-Modelle mit Qwen — Zero-Cost-Agenten-Setup

Wie du Qwens kostenlose Modelle für KI-Agenten nutzt: Setup, Konfiguration, Kostenvergleich und Multi-Agenten-Deployment.

Weiterlesen
agents

Multi-Agenten-Orchestrierung — vom Einzelagenten zur Pipeline

Wie man mehrere KI-Agenten zu zuverlässigen Pipelines orchestriert — mit Routing-Strategien, Lifecycle-Management und modellspezifischer Zuweisung.

Weiterlesen
infrastructure

KI-Agenten selbst hosten — vollständige Setup-Anleitung für einen VPS

Eine praxisnahe Anleitung zum Betrieb von KI-Agenten auf einem eigenen Server mit Node.js, nginx, SSL, Firewall-Konfiguration und Messenger-Integration.

Weiterlesen