PKM·Wiki

KI-Tools & Plattformen

LangSmith – Wiederverwendbare Evaluatoren und Evaluator-Templates

Aktualisiert 2026-04-20 · Version 1.0

LangSmith – Wiederverwendbare Evaluatoren und Evaluator-Templates

LangSmith veröffentlicht zwei neue Features für die Agent-Evaluation: eine Template-Bibliothek mit über 30 vorgefertigten Evaluatoren sowie einen zentralen Evaluators-Tab für workspace-weite Wiederverwendung bestehender Evaluatoren.

Kernaussagen


Warum Evaluierungen ins Stocken geraten

Zu definieren, was „gut" bedeutet, ist eines der schwierigsten Probleme beim Aufbau von Agenten. Typische Stolpersteine:

Evaluation wird auf mehreren Ebenen benötigt:

Ebene Was wird gemessen?
Einzelne Schritte Korrekte Tool-Auswahl, Formatierung
Trajektorie Hat der Agent die richtigen Schritte in der richtigen Reihenfolge unternommen?
Gespräch (Multi-Turn) Konsistenz über mehrere Turns hinweg
Tool-Aufrufe Korrekte Parameter, Delegation an den richtigen Sub-Agenten

Das Aufbauen von Evaluatoren über alle diese Ebenen kann Wochen dauern: Prompt schreiben → gegen echte Daten validieren → anpassen → wiederholen.


Evaluator-Templates

Die Templates decken die am häufigsten nachgefragten Kategorien ab:

Templates enthalten sowohl LLM-as-Judge-Evaluatoren (mit getunten Prompts) als auch regelbasierte Code-Evaluatoren. Sie funktionieren für:

Die Templates sind auch im Open-Source-Paket openevals v0.2.0 verfügbar, jetzt mit Multimodal-Support für Sprach- und Bildausgaben.


Wiederverwendbare Evaluatoren

Der neue Evaluators Tab in LangSmith:

Praxisbeispiel

  1. Prompt-Injection-Evaluator aus einem Template erstellen.
  2. Prompt tunen und gegen Beispieldaten validieren.
  3. Den fertigen Evaluator mit einem Klick an alle Produktions-Tracing-Projekte anhängen.
  4. Bei einer Prompt-Verbesserung: Update einmal vornehmen → gilt überall.

Ausblick

Als nächstes plant LangSmith Spend Visibility: Transparenz über die Kosten von Evaluierungsläufen sowie die Möglichkeit, Budgets zu setzen.


Quellen

Erstellt aus raw/Reusable Evaluators and Evaluator Templates in LangSmith.md

Seite löschen