AI NLP

Mehrsprachige Smart Speaker im Jahr 2020

julia

Von Julia Pflüger | Voice User Interface Architektin bei VUI.agency | 20.07.2020

Als deutsche Muttersprachlerin bin ich es gewohnt, alle möglichen Benutzeroberflächen in meiner Muttersprache zur Verfügung zu haben. Obwohl viele Geräte, wie zum Beispiel Smart Speaker, zuerst auf dem englischsprachigen Markt erhältlich sind, dauert es in der Regel nicht lange, bis sie mit vollständig ins Deutsche übersetzten Benutzeroberflächen auch auf den deutschen Markt kommen.

kobu agency_unsplash

Heute werden weltweit insgesamt 7.117 Sprachen gesprochen (Ethnologue.com), obwohl es 23 Hauptsprachen gibt, die von ganzen 50% der Weltbevölkerung gesprochen werden. Natürlich würde sich eine Marke bei der Entscheidung, welche Sprachen ihre KI lernen soll, aufgrund der großen Zahl potenzieller Nutzer_innen auf diese 23 Sprachen konzentrieren, aber was ist mit den Menschen, deren Muttersprache zu den verbleibenden 7.094 gehört? In einer Welt, in der die Sprachtechnologie in Form von Smart Speakern, Smart Home-Geräten sowie Suche und Shopping per Spracheingabe eine immer wichtigere Rolle zu spielen scheint, wird es für die Menschen ebenso wichtig, einen angemessenen Zugang zu dieser Technologie zu erhalten. Und die einzige Möglichkeit, dies zu erreichen, besteht darin, sicherzustellen, dass der Sprachassistent den bzw. die Benutzer_in versteht und der bzw. die Benutzer_in im Gegenzug auch den Sprachassistenten versteht.

In einem fremdsprachigen Film gibt es normalerweise Untertitel,
die uns helfen, das Gesprochene zu verstehen, aber eine solche
Hilfe gibt es bei einem Smart Speaker eben nicht - das Verstehen
dessen, was der Sprachassistent sagt, ist hier absolut
entscheidend.

Auf dem heutigen Smart Speaker-Markt gehören Amazons Alexa-Geräte und Googles Home/Nest Smart Speaker zu den beliebtesten und meistverkauften Geräten, aber ihr derzeitiger SprachSupport scheint eher unterdurchschnittlich zu sein, insbesondere im Vergleich zu den Sprachassistenten, die auf mobilen Geräten wie Smartphones und Tablets verfügbar sind:

SpracheAmazon AlexaGoogle Home/Nest
Dänischx
Niederländischx
Englischxx
Französischxx
Deutschxx
Hindixx
Italienischxx
Japanischxx
Koreanischx
Norwegischxx
Bras. Portugiesischxx
Spanischx
Schwedischx
Thaix
Gesamt814

Sprachen, die derzeit auf Amazons und Googles Smart Speakern unterstützt werden (Globalme.net)

Im Vergleich zur Smart Speaker-Version unterstützt der auf Android-Geräten verfügbare Google Assistant viel mehr Sprachen wie etwa Arabisch, Bengalisch, Chinesisch, Tamil oder Russisch, die ganz oben auf der Liste der Sprachen mit den meisten Muttersprachlern stehen und damit einige der prominenten europäischen Sprachen sogar übertreffen. Der auf dem iPhone verfügbare Sprachassistent Siri unterstützt ebenfalls ganze 21 Sprachen. Alexas Sprach-Support konzentriert sich verständlicherweise auf Länder, die ihren eigenen Amazon-Marketplace haben, aber es ist dennoch auffallend, wie wenig Sprachen unterstützt werden, verglichen damit, wie mehrsprachig die Welt tatsächlich ist. So fehlen beispielsweise die vielen afrikanischen Sprachen sowie verschiedene andere asiatische Sprachen und in Europa die skandinavischen und slawischen Sprachen. Auch wenn Amazon derzeit den Spitzenplatz für die höchste Anzahl an weltweit verkauften Smart Speakern einnimmt (26,2% Marktanteil im Jahr 2019), wird der erweiterte Sprach-Support einer der wichtigsten Faktoren sein, um den kontinuierlichen Erfolg und das Wachstum von Alexa auf globaler Ebene sicherzustellen. Darüber hinaus scheint es, dass sowohl Amazon als auch Google den chinesischen Markt für Smart Speaker weitgehend ignorieren. Dieser wird aktuell hauptsächlich von bekannten chinesischen Technologieunternehmen wie Xiaomi, Baidu und Alibaba beherrscht. Alle drei dieser Unternehmen rangieren derzeit bei der Anzahl der weltweit verkauften Smart Speaker direkt hinter Google, obwohl ihre Produkte nur in China erhältlich sind.

Aber die Unterstützung globaler Sprachen ist nicht die einzige sprachliche Herausforderung in der Welt der Smart Speaker: Selbst wenn eine Sprache o!ziell unterstützt wird, gibt es in der Regel viele nationale und regionale Varietäten, Dialekte und Akzente, die einzelne Nutzergruppen voneinander unterscheiden.

Das prominenteste Beispiel ist die englische Sprache: Man kann theoretisch jede mögliche Benutzeroberfläche auf Englisch anbieten, müsste dafür aber eine der vielen Sprach-Varietäten wählen, die es auf der Welt gibt – amerikanisches Englisch, britisches Englisch, kanadisches Englisch, australisches Englisch, neuseeländisches Englisch, indisches Englisch, singapurisches Englisch (von denen die meisten sowohl von Alexa- als auch von Google-Smart Speakern unterstützt werden). Und dies sind nur einige der wichtigsten Varietäten der englischen Sprache. Egal, für welche Varietät man sich letztendlich entscheidet – es wird immer englischsprachige Nutzer_innen geben, die sich nicht vollständig mit der verwendeten Sprache identifizieren können, was folglich die Freude der Nutzer_innen und damit die kontinuierliche Nutzung des Gerätes beeinträchtigt. Besonders in der Welt der Sprachassistenten, in der die Sprache klar im Mittelpunkt der Technologie steht, kann dies eine große Herausforderung darstellen.

Ein ähnliches Problem besteht auch im deutschsprachigen Raum, der hauptsächlich die Länder Deutschland, Schweiz und Österreich umfasst. Oberflächlich betrachtet sprechen alle drei Länder Deutsch (ggf. neben anderen offiziellen Sprachen), aber wie wahrscheinlich jede deutsche Person bestätigen kann – nur weil wir auf dem Papier alle die gleiche Sprache sprechen, bedeutet dies nicht, dass wir uns problemlos verstehen könnten. Ich kann gar nicht mehr nachzählen, wie oft ich eine Person aus Österreich oder der Schweiz nicht verstanden habe und überzeugt war, dass österreichisches oder Schweizerdeutsch eine völlig andere Sprache ist als deutsches Deutsch. Und das beruht nicht nur auf dem Akzent und der Art und Weise, wie die einzelnen Laute und Wörter ausgesprochen werden – so enthalten die österreichischen und Schweizer Varietäten beispielsweise zahlreiche Wörter, die eine deutsche Person nicht benutzt und umgekehrt. Und das Problem hört damit nicht auf, denn selbst in einer einzigen Varietät gibt es noch deutliche Variation auf regionaler und sogar gesellschaftlicher Ebene – man vergleiche nur mal einen Berliner Dialekt aus Norddeutschland mit einem Münchner Dialekt aus Süddeutschland, zum Beispiel.

Warum sollten wir also eine Person in der Schweiz zwingen, mit einem Smart Speaker in einer Varietät zu sprechen, die sie normalerweise nicht verwendet, nur weil der Smart Speaker ihren eigenen lokalen Schweizer Dialekt nicht unterstützt?

Ich bin mir sicher, dass ich persönlich keinen Sprachassistenten benutzen würde, wenn ich mit ihm in Schweizerdeutsch sprechen müsste. Um dieses spezielle Problem zu lösen, arbeitet VUI.agency derzeit mit dem Schweizer Telekommunikationsanbieter Swisscom an dessen Sprachassistenten „Hey Swisscom“, der unter anderem Schweizerdeutsch verstehen und sprechen kann. Der Assistent ist auf der Swisscom TV-Box verfügbar und ermöglicht es den Benutzer_innen, ihre TV-Funktionen und Smart Home-Geräte zu steuern sowie die üblichen Smart Speaker Funktionen wie Nachrichten und Wetterbericht zu nutzen. Und das alles in einer Sprach-Varietät, mit der sich die Nutzer_innen tatsächlich wohl fühlen.

Swisscom TV Box (swisscom.ch)

Zusammenfassend lässt sich sagen, dass es für Unternehmen, die Sprachtechnologien einsetzen, wichtig ist, Sprach Support für eine Vielzahl von Weltsprachen und Dialekte anzubieten. Da der Markt für Smart Home und Sprachtechnologien ständig wächst, täten Marken gut daran, den großen Teil der Weltbevölkerung, der weder Englisch, Spanisch, Französisch noch eine der anderen großen europäischen Sprachen spricht, nicht zu übersehen – trotz der verschiedenen Herausforderungen, die das Sprachenlernen im Bereich der Sprachtechnologie mit sich bringt. Natürlich ist es zeitaufwendig und teuer, einem Sprachassistenten eine neue Sprache beizubringen, und bei der Entscheidung, welche neue Sprache hinzugefügt werden soll, werden Marken natürlich die Anzahl der potenziellen Benutzer_innen berücksichtigen, die davon profitieren werden. Dennoch wird der Weg zu kontinuierlichem Erfolg und Wachstum auf dem Smart Speaker-Markt auch den Sprach-Support für möglichst viele Weltsprachen und Varietäten einschließen – ganz gleich, wie unbedeutend eine Sprache aus wirtschaftlicher Sicht auch erscheinen mag.

Share via