Alle Episoden
03
52 min

Speech-to-Text im Praxisalltag – Interview mit Sabine Kunert

Tierheilpraktikerin Sabine Kunert zeigt, wie Speech-to-Text ihre Anamnesen und Therapiedokumentation revolutioniert hat – und warum erst der Workflow stimmen muss, bevor man automatisiert.

Speech-to-TextTierheilkundeAnamneseWorkflowInterviewDatenschutz

Externer Inhalt blockiert

Der Podcast-Player wird von Podigee bereitgestellt. Bitte akzeptiere externe Inhalte in den Cookie-Einstellungen, um den Player zu laden.

Das nimmst du mit

  • Speech-to-Text ermöglicht volle Präsenz am Tier – statt mitzuschreiben kann man wirklich zuhören und beobachten.
  • Letterly ist das empfohlene Tool für lange Einzelperson-Transkripte: bis zu 90 Minuten Aufnahme, sehr akkurate Fachbegrifferkennung.
  • Online-Anamnesen per Video-Call mit Transkription liefern deutlich mehr Informationen als schriftliche Fragebögen.
  • Datenschutz zuerst: Einverständnis einholen, personenbezogene Daten weglassen und DSGVO-konforme Tools wie Sully nutzen.
  • Erst den Workflow optimieren, dann automatisieren – ein schlechter Prozess wird durch KI nicht besser, nur schneller schlecht.

Zu Gast: Sabine Kunert – Tierheilpraktikerin und KI-Enthusiastin

Sabine Kunert arbeitet seit zwölf Jahren in der Tier- und Naturheilkunde, seit fünf Jahren mit dem Schwerpunkt Shiatsu-Akupunktur für Pferde, Hunde und Katzen. Ergänzt durch sieben Jahre praktische Erfahrung in der Tierarztpraxis verbindet sie klassische Medizin und Naturheilkunde – und sucht dabei ständig nach Wegen, weniger Zeit im Büro und mehr Zeit am Tier zu verbringen.

Genau da kommt Speech-to-Text ins Spiel.

Das Problem: Anamnesen dauern anderthalb Stunden

Eine Anamnese bei Sabine ist keine Checkliste. Es ist Detektivarbeit. Gerade bei chronisch kranken Tieren – etwa einem Pferd mit äquinem Asthma – entstehen Gespräche von 30 bis 90 Minuten. Es geht nicht nur um Standardsymptome wie Husten oder Auswurf, sondern um Atemfrequenz, Dampfrinnen, saisonale Muster, Stress, Medikamentenhistorie, Haltung, Fütterung und vieles mehr.

All diese Informationen hängen zusammen, tauchen aber über das Gespräch verteilt auf. Wer da gleichzeitig zuhört, nachfragt und mitschreibt, verliert zwangsläufig etwas. Speech-to-Text löst dieses Problem elegant: Die Aufzeichnung übernimmt das Protokoll. Die Therapeutin bleibt präsent.

Wenn ich nicht mitschreiben muss, kann ich wirklich zuhören – und beobachten, was Tier und Mensch miteinander machen. Das ist für mich entscheidend.

Sprachliche Kommunikation schlägt Fragebögen

Ein Punkt, der in der Praxis den entscheidenden Unterschied macht: Im Gespräch erzählen Tierbesitzer deutlich mehr als sie je in ein Formular schreiben würden. Wer einen Fragebogen ausfüllt, denkt zuerst: Wie kriege ich das möglichst kurz hin? Im gesprochenen Dialog dagegen kommen Details zur Sprache, die auf den ersten Blick unwichtig erscheinen – aber für die Diagnose entscheidend sein können.

Speech-to-Text eliminiert diesen Engpass und kehrt den Vorteil sogar um: Mehr Information, weniger Aufwand für alle Beteiligten.

Die besten Tools für den Praxisalltag

Letterly – die Empfehlung für lange Einzelgespräche

Für Sabines Kernaufgabe – lange Einzel-Transkriptionen – ist Letterly die klare Empfehlung:

  • Nimmt bis zu 90 Minuten am Stück auf
  • Erkennt Fachbegriffe überraschend präzise, auch naturheilkundliche und tiermedizinische Termini
  • Verfügbar für iOS und Android
  • Brauchte anfangs noch eine Glossar-Funktion, mittlerweile ist die Transkriptqualität so gut, dass sie überflüssig geworden ist

VoiceNotes ist eine Alternative, bietet kürzere Aufnahmedauer und benötigt eher ein Glossar für Fachbegriffe – insgesamt weniger akkurat, aber für kürzere Eingaben durchaus brauchbar.

Für Video-Calls: MS Teams und Sully

Bei Online-Anamnesen per Video-Call bieten sich andere Lösungen an:

MS Teams bringt in bestimmten Abonnements bereits eine Transkriptionsfunktion mit – praktisch, wenn sowieso über Teams kommuniziert wird.

Sully ist besonders interessant: Ein deutsches Unternehmen, das als Teilnehmer direkt in Videokonferenzen eingeladen werden kann und DSGVO-konform transkribiert. Für den therapeutischen Kontext mit sensiblen Gesundheitsdaten ein wichtiger Faktor.

ChatGPT Voice Mode und Gemini Live – eher zum Kennenlernen

Der direkte Sprachmodus in ChatGPT oder Gemini ist faszinierend. Die Antworten wirken zunehmend natürlich, fast menschlich. Für lange, strukturierte Anamnesen sind diese Tools aber noch nicht geeignet: ChatGPT bricht bei Pausen manchmal ab, Gemini antwortet zu formelhaft. Zum Experimentieren und Kennenlernen der KI-Interaktion sind sie trotzdem empfehlenswert.

Der Workflow: Vom Gespräch zum Therapieplan

So sieht der Ablauf in der Praxis konkret aus:

1. Vorbereitung

Stammdaten des Tieres werden vorab digital erfasst: Rasse, Alter, Vorgeschichte. Das geschieht über die Anmeldung in der Praxis-Datenbank, noch bevor das eigentliche Gespräch beginnt.

2. Anamnese-Gespräch

Ob online per Video-Call oder vor Ort – am Anfang steht immer die Frage: Darf ich aufzeichnen? Nach dem Einverständnis beginnt das Gespräch. Personenbezogene Daten werden bewusst weggelassen oder erst nachträglich manuell ergänzt.

Dann wird zugehört. Wirklich zugehört. Die Tierbesitzer erzählen, und es wird gezielt nachgefragt – chronologisch, systematisch, aber ohne den Gesprächsfluss zu unterbrechen.

3. Transkription

Über Letterly (bei Vor-Ort-Terminen) oder den Video-Call-Dienst (bei Online-Terminen) entsteht ein vollständiges Transkript des Gesprächs.

4. Strukturierung mit Claude

Das Transkript wird in Claude eingegeben. Das Sprachmodell strukturiert den gesamten Gesprächsinhalt in eine klassische Anamnese-Form: Signalment, Hauptbeschwerden, Krankheitsgeschichte, aktuelle Symptome, Haltung, Fütterung, Vorbehandlung, eigene Beobachtungen.

Warum ausgerechnet Claude? Die sprachliche Qualität und die Erkennung naturheilkundlicher und medizinischer Fachbegriffe sind bei Claude besonders stark ausgeprägt. Jedes Modell hat seine Stärken – für strukturiertes Arbeiten mit medizinischen Texten hat sich Claude bewährt.

5. Weiterverarbeitung

Ab hier wird es richtig spannend. Aus der strukturierten Anamnese lassen sich direkt weiterführende Analysen ableiten:

  • Supplement-Listen analysieren: Welche Präparate bekommt das Pferd? Wie viel Magnesium steckt insgesamt drin, wenn drei verschiedene Ergänzungsmittel plus Müsli gefüttert werden? Ist das zu viel, zu wenig, oder genau richtig?
  • Blutwerte in Kontext setzen: Chronologische Aufbereitung von Laborergebnissen, Vergleich über mehrere Zeitpunkte
  • Heuanalyse einbeziehen: Wenn eine Analyse vorliegt, fließt sie direkt in die Gesamtbewertung des Grundfuttermittels ein
  • Therapiepläne formulieren: Individuell auf das Tier und die Situation zugeschnitten

6. Personalisierte Pläne erstellen

Ein besonders praktischer Schritt: Aus einem Gesamtplan entstehen individuelle Versionen für jede beteiligte Person. Der Tierbesitzer bekommt seinen Plan, der Stallbetreiber seinen, die Reitbeteiligung ihren – jeweils mit den relevanten Informationen und Aufgaben. Früher war das aufwändige Handarbeit. Mit KI ist es eine Frage von Minuten.

Datenschutz: Die wichtigsten Regeln

Ein sensibles Thema, das gerade im therapeutischen Kontext nicht verhandelbar ist:

  • Einverständnis einholen, bevor aufgezeichnet wird – immer
  • Personenbezogene Daten weglassen: Statt „Ulrike Meier, Müllerstraße 29" einfach „mein 10-Uhr-Termin" sagen. Persönliche Daten werden am Ende manuell ergänzt
  • DSGVO-konforme Tools bevorzugen: Sully als deutsches Unternehmen, MS Teams in bestimmten Konfigurationen
  • Aufnahmen nach Verarbeitung löschen oder auf sicheren Datenträgern speichern
  • Bei der Weiterverarbeitung in Sprachmodellen: Keine personenbezogenen Daten in den Prompt eingeben

Erst optimieren, dann automatisieren

Viele der beschriebenen Schritte sind aktuell noch manuell – und das ist bewusst so. Die einzelnen Bausteine funktionieren bereits hervorragend, aber der Workflow wird noch aktiv ausprobiert und verfeinert.

Wenn du einen schlechten Prozess automatisierst, hast du danach keinen guten Prozess – du hast nur einen automatisierten schlechten Prozess.

Erst verstehen, was funktioniert. Dann optimieren. Und wenn der Prozess rund läuft, kann die Automatisierung kommen – ob über Zapier, Make, n8n oder direkte Integrationen in den Transkriptions-Tools. Die Möglichkeiten wachsen täglich.

KI und eigenes Know-how: Die Kombination macht den Unterschied

Ein zentraler Gedanke aus dem Gespräch: KI sollte immer auf eigenen, validierten Daten und eigenem Fachwissen arbeiten. Wer in der Naturheilkunde eine Standardantwort aus dem Internet bekommt, hat wenig gewonnen. Wer aber sein eigenes Know-how strukturiert in ein Sprachmodell einbringt – und die KI dann auf dieser Basis arbeiten lässt – bekommt ein mächtiges Werkzeug an die Hand.

Die Vision: Ein eigenes RAG-System (Retrieval Augmented Generation) mit persönlicher Wissensdatenbank im Hintergrund, das ausschließlich auf die eigenen Erfahrungen und Daten zurückgreift. Noch Zukunftsmusik, aber die Richtung stimmt.

Ausblick

Drei neue Podcast-Themen sind aus diesem Gespräch entstanden: Text-to-Speech als Gegenstück, KI-Agenten für strukturierte Anamneseprozesse und der Einsatz von RAG-Systemen mit eigener Wissensdatenbank. Die KI-Welt entwickelt sich schnell – aber der Ansatz bleibt: Erst verstehen, dann anwenden.