Beitragsbild erstellt mit Adobe Photoshop Beta generative fill (KI)
Momentan, Mitte 2023, ist Künstliche Intelligenz (kurz KI) ja das Thema, vielleicht sogar das Thema des Jahres. Aber eines steht fest: KI ist gekommen, um zu bleiben. Genau wie die Dampfmaschine im 18. Jahrhundert (erste Entwicklungen gabs sogar schon Anfang des 17. Jahrhunderts), der Transistor in den 1960ern, kurz darauf der Computer und dann das Internet und Mobiltelefonie. Den Impact, den die Massentauglichkeit von KI haben wird, ist noch nicht im geringsten abzuschätzen. Fest steht nur: "Mit großer Macht kommt große Verantwortung" (ich glaube das ist aus einem Spiderman Film 🤔)
Das möchte ich in diesem Blogartikel aber gar nicht so detailreich ausführen, denn hier gehts um die Sprechstimme. Genau so wie man mit KI Unterhaltungen führen kann (ChatGPT) oder Bilder erstellen (Midjourney), kann man mit einer entsprechend trainierten KI auch menschliche Stimmen nachahmen. Was das für die Notwendigkeit eines Sprechstimmtrainings bedeutet, dazu habe ich schon früher einen Blogartikel verfasst, den du hier nachlesen kannst.
Hier möchte ich darauf eingehen, was wir daraus lernen können. Hast du schon einmal KI generierte Stimmen gehört? Was für Emotionen lösen die bei dir aus? Ich kann für meinen Teil behaupten, dass die sehr flach und neutral klingen. Selbst wenn versucht wird, einen gewissen Enthusiasmus und Schwung in die Sprechweise zu verpacken, kann man immer noch hören, dass das irgendwie "gefälscht" klingt. Ich kann es nicht genau festmachen, doch bei mir läutet irgendein Alarmglöckchen, das mir sagt: Mit dieser Stimme stimmt etwas nicht.
Und ich vermute den Grund darin, dass eine KI generierte Stimme einfach keine echten Emotionen hineinpackt, sondern einfach nur analysierte Stimmen nachahmt und dabei irgendein Mischmasch herauskommt. Der mag zwar noch so subtil sein, doch wir Menschen sind derart feinfühlig was den Klang der menschlichen Stimme angeht, dass uns kleinste Nuancen auffallen. Und das ist auch gut so. Schließlich war es für Jahrtausende von Bedeutung anhand der Stimme herauszufühlen, was die wahren Absichten unseres Gegenübers sind. Ich sage deshalb fühlen, weil es unterbewusst passiert. Genau so, wie unsere Augen eine unglaublich feine Auslösung erkennen können und so viele unterschiedliche Farben wahrnehmen können, ist auch unser Gehörsinn in der Lage nicht nur feinste Geräusche zu hören und zu deuten. So auch im Klang der menschlichen Stimme.
Während es für manche Anwendungsbereiche sicherlich funktioniert, eine KI generierte Stimme zu verwenden (zB. Telefonansagen oder Warteschleifen), wird es vor Allem in der zwischenmenschlichen Kommunikation von nun an umso wichtiger sein, Vertrauen zu schaffen, dass man ein Mensch ist. Das wird insbesondere für den Servicebereich gelten und damit auch für all jene, die ein Online Business betreiben, wo es auf persönlichen Kontakt ankommt. Nicht nur in der Verkaufsphase, sondern auch in der Dienstleistungsphase. Wenn dir deine potenziellen Kunden schon nicht wirklich vertrauen, dann werden sie nicht bei dir kaufen, sondern bei jemand anderem. Und wer bei dir gekauft hat, den wirst du mit deiner persönlichen Präsenz von der Richtigkeit seiner Entscheidung überzeugen.
Zusammengefasst meine ich: KI Stimmen schön und gut. Doch im Sales zählt immer noch Persönlichkeit und Vertrauen. Was wir daraus lernen können ist, dass die menschliche Stimme von nun an sogar noch wichtiger sein wird, um dich als Mensch zu "identifizieren". Nicht nur im Business, sondern auch im privaten Bereich.
(Übrigens habe ich das Bild zu diesem Blogbeitrag mit einer KI erzeugt 🙂