Es ist ein Phänomen, das viele Nutzer kaum noch hinterfragen: Wenn man einen KI-Assistenten wie Siri, Alexa oder Cortana aktiviert, antwortet meist eine weibliche Stimme.
Selbst wenn man heute zwischen verschiedenen Stimmen wählen kann, bleibt die weibliche Stimme oft die Standardoption. Doch warum ist das so? Und sollte uns das überhaupt beunruhigen? Die Antwort liegt nicht nur in technischen Entscheidungen, sondern in tief verwurzelten gesellschaftlichen Mustern, die sich über Jahrzehnte in die Technologie eingeschlichen haben.
Die frühen Sprachassistenten wurden in einer Zeit entwickelt, in der die verfügbaren Sprachdaten, etwa aus Kundenservice-Aufzeichnungen oder Telefonarchiven, überwiegend weibliche Stimmen enthielten. Frauen waren in diesen Berufen traditionell überrepräsentiert, und so spiegelte die Technik einfach das wider, was bereits existierte. Doch es geht hier nicht nur um Daten. Es geht um eine kulturelle Assoziation, die viel älter ist als die digitale Welt. Schon lange bevor es KI gab, wurden Hilfsfunktionen mit weiblichen Rollen verknüpft. Telefonistinnen, Sekretärinnen, Empfangsdamen – diese Berufe galten als typisch weiblich, weil sie mit Fürsorge, Geduld und emotionaler Arbeit verbunden waren. Diese Vorstellung hat sich bis heute gehalten, auch wenn die Berufswelt sich verändert hat.
Unternehmen rechtfertigten die Wahl der weiblichen Stimme oft mit Studien, die besagten, dass Menschen weibliche Stimmen als angenehmer, vertrauenswürdiger oder einfacher zu verstehen empfänden. Es gibt tatsächlich Forschung, die solche Präferenzen bestätigt, doch sie ist nicht eindeutig. Unsere Wahrnehmung wird stark von sozialen Normen geprägt. Was wir als „angenehm“ oder „vertrauenswürdig“ empfinden, hängt davon ab, welche Stimmen wir in welchen Rollen gewohnt sind. Ein weiteres Argument, das oft zitiert wird, ist, dass Babys bereits im Mutterleib auf die Stimme ihrer Mutter reagieren und sie deshalb später weibliche Stimmen bevorzugen würden. Doch Experten wie die KI-Forscherin Kate Devlin widerlegen diesen Mythos. Babys mögen in den ersten Monaten weibliche Stimmen bevorzugen, aber das sagt nichts über die Präferenzen von Erwachsenen aus. Unsere Vorlieben entwickeln sich, und sie sind nicht festgeschrieben.
Ein weiteres Problem ist die Rolle der Popkultur. In Science-Fiction-Filmen und -Serien werden intelligente Maschinen oft als weiblich dargestellt, als hilfsbereit, emotional, manchmal sogar verführerisch. Denken Sie an den Film „Her“, in dem der Protagonist eine Liebesbeziehung zu einer KI mit weiblicher Stimme eingeht, oder an die zahlreichen weiblichen Roboter in Filmen, die stets dienstbereit und unterwürfig agieren. Solche Darstellungen prägen unser Unterbewusstsein und verstärken die Erwartung, dass KI-Assistenten weiblich sein sollten und damit auch passiv, gehorsam und emotional verfügbar.
Doch warum sollte uns das überhaupt kümmern? Schließlich kann man die Stimme ja ändern. Die Antwort liegt in der Symbolik. Es geht nicht nur um die Stimme, sondern um das, was sie repräsentiert. Wenn KI-Assistenten standardmäßig weiblich klingen, vermittelt das eine Botschaft: Wer dient, ist weiblich. Wer gehorcht, ist weiblich. Wer emotional zur Verfügung steht, ist weiblich. Und wer Autorität ausübt, ist männlich. Diese Unterscheidung wird durch die Technologie nicht nur widergespiegelt, sondern sie wird verstärkt. Studien zeigen, dass geschlechtsspezifische Technologie nicht nur Stereotype widerspiegelt, sondern sie auch festigt. Nutzer erwarten von weiblichen Stimmen mehr Geduld, mehr Freundlichkeit, mehr Unterwerfung. Und wenn diese Erwartungen nicht erfüllt werden, reagieren sie oft aggressiv. Dies verleitet die Entwickler dazu, die Stimmen noch passiver zu gestalten, um Konflikte zu vermeiden.
Ein weiteres Problem ist die mangelnde Diversität in den Entwicklerteams. Frauen sind in der KI-Entwicklung nach wie vor unterrepräsentiert. Schätzungen zufolge halten sie weltweit nur etwa ein Viertel der KI-bezogenen Positionen und weniger als fünfzehn Prozent der Führungspositionen. Wenn die Technik von überwiegend männlichen Teams entwickelt wird, spiegelt sie oft deren Perspektive und auch deren Vorurteile wider. Die Frage ist also nicht nur, wie die KI klingt, sondern auch, wer sie gestaltet.
Es gibt Hoffnung. Immer mehr Assistenten bieten heute neutrale oder männliche Stimmen an. ChatGPT etwa lässt Nutzer zwischen verschiedenen Stimmen wählen, darunter auch solche mit neutraler Klangfarbe. Doch das reicht nicht aus. Es braucht klare Standards, die Geschlechterstereotypen in der Technik verhindern. Es braucht mehr Frauen in den Entwicklerteams. Und es braucht ein Bewusstsein dafür, dass Technologie nicht neutral ist, denn sie trägt die Werte und Vorurteile ihrer Schöpfer in sich.
Die Zukunft der KI muss nicht so aussehen wie ihre Vergangenheit. Wir können sie fairer, vielfältiger, weniger stereotypisch gestalten. Denn Technologie formt unsere Gesellschaft und unsere Gesellschaft formt die Technologie. Wenn wir wollen, dass sie gerechter wird, müssen wir an diesem Kreislauf ansetzen. Und das beginnt damit, über die Stimme nachzudenken und darüber, wer sie eigentlich spricht.