Zum Inhalt springen

Protokoll-Übersicht

UIAP ist ein Standardvertrag zwischen laufender Anwendung und KI-Agent, damit die Anwendung dem Agenten strukturiert sagen kann, was gerade sichtbar ist, was fachlich möglich ist, was riskant ist, wie etwas ausgeführt werden darf und woran Erfolg oder Fehler erkennbar sind.

  • Ein UI-Vertragsprotokoll
  • Ein Capability- und State-Protokoll
  • Ein Action- und Feedback-Protokoll
  • Ein Policy- und Audit-Protokoll
  • Kein LLM-Prompt-Format
  • Kein Voice-Protokoll
  • Kein Ersatz für Accessibility
  • Kein Ersatz für Browser-Automation
  • Nicht nur ein SDK
  • Keine Magie, die schlechte Apps plötzlich steuerbar macht
#ModulZweck
1CoreMessage Envelope, Session Lifecycle, Fehler, Versionierung, Erweiterungen
2Capability ModelUI-Rollen, Zustände, Affordances, Actions, Risk, Success Signals
3Web ProfileDOM, ARIA, PageGraph, iframes, Shadow DOM, Routen, Formulare, Modale
4Action RuntimeAction-Ausführung, Verifikation, Result Reporting
5Policy ExtensionBerechtigungen, Bestätigungen, Sensitivität, Audit
6SDK APIClient-seitige Integrations-API für Web-Anwendungen
7Workflow ExtensionSkills, Onboarding-Flows, Schritt-Orchestrierung
8Discovery MapperAutomatische UI-Element-Erkennung und -Klassifizierung
9Authoring/ManifestManifest-Formate, Authoring-Workflows, Validierung
10Conformance SuiteTestmodule, Harness-Modell, Bewertungsregeln
  1. App bindet das UIAP SDK ein
  2. Session startet (session.initialize)
  3. App sendet Capabilities (capabilities.list)
  4. App sendet aktuellen Live-Zustand (state.snapshot)
  5. Agent plant nächste Aktion (z.B. action.request(click video.new))
  6. SDK prüft Policy und Ausführungsmodus (bevorzugt appAction, Fallback semanticDom)
  7. SDK animiert optional Ghost Cursor (rein Präsentation)
  8. SDK führt die Aktion aus und sendet action.started
  9. App beobachtet Ergebnis (Route-Change, Toast, Feldwert, Dialog-Schluss)
  10. App sendet Feedback + Delta (action.succeeded + state.delta)
  11. Agent plant den nächsten Schritt (bis Ziel erreicht oder User übernimmt)
  12. Session endet und Trace wird abgeschlossen (session.end)