Das Impressum bei Voice Apps (Amazon Skills, Google Actions)

Braucht ein Alexa Skill oder eine Google Action ein Impressum? Natürlich müssen sich Unternehmen auch mit dieser Frage auseinander setzen. Deshalb hat sprachassistenten.marketing hat zu dieser Frage einen spezialisierten Anwalt befragt, der die folgenden Informationen zur Verfügung gestellt hat:

Bernhard Kloos ist Partner bei HK2 Rechtsanwälte und spezialisiert auf IT-Recht, Wettbewerbsrecht und Datenschutz. Er ist außerdem Geschäftsführer der HK2 Comtection GmbH und externer Datenschutzbeauftragter, z.B. für Online- oder KI-Anbieter.

Voice Apps (z.B. Alexa Skills) sind Programme, mit denen man sprachgesteuert Dialoge oder Funktionalitäten auf Lautsprechern oder Smart Home Geräten (z.B. Amazon Echo, Google Home) ausführen kann. In der Regel erfolgt dies als Ergänzung zu den auf den Geräten installierten Sprachassistenten (z.B. Alexa, Siri, Google Assistant, Cortana). Beliebt sind etwa Voice Apps zu Nachrichten, Rezepten oder Einkaufslisten.

Eine Voice App kann vom Hersteller des Gerätes, vom Anbieter des Sprachassistenten oder auch von Dritten bzw. Entwicklern angeboten werden. Teilweise muss sich der Kunde dazu separat beim Anbieter registrieren und ein Benutzerkonto anlegen. Die meisten Drittanbieter nutzen Voice Apps bislang nur zu Informationszwecken, zur Werbung oder zur Kundenbindung. Der Verkauf von Waren oder Dienstleistungen wird mit der Voice App zumeist nur vorbereitet. Es wird aber nicht mehr lange dauern, bis die Bestellung mittels Sprachsteuerung alltäglich wird.

Ist für Voice Apps (Alexa Skill, Google Action) ein Impressum notwendig?

Bei Voice Apps handelt es sich rechtlich um Telemedien, d. h. um elektronische Informations- und Kommunikationsdienste (vgl. für den Amazon Dash Button OLG München, Urt. v. 10.01.2019, Az. 29 U 1091/18). Der Anbieter muss dann bestimmte Pflichtangaben über sich leicht erkennbar, unmittelbar erreichbar und ständig verfügbar halten (siehe § 5 TMG bzw. § 55 Rundfunkstaatsvertrag). Diese sog. Impressumspflicht (weitere Hinweise hier) gilt auch dann, wenn keine direkte Einkaufsmöglichkeit über die Voice App besteht.

Wie und wo macht man ein Impressum für Voice Apps?

Fraglich ist, wie der Anbieter einer Voice App seiner Impressumspflicht nachkommen kann. Bei den Skill-Details zur Beschreibung eines Alexa Skills kann man eine Entwickler-Datenschutzerklärung sowie Entwickler-Nutzungsbedingungen angeben. Entweder man verlinkt hier zusätzlich (auch) unmittelbar auch das Impressum oder man bindet einen gut sichtbaren Link auf das Impressum in mittels den Skill-Details verlinkten AGB oder der Datenschutzerklärung ein. Selbst prominente Apps wie z.B. diejenige von tagesschau.de vergessen das. Soweit zusätzlich vor Nutzung der Voice App eine Registrierung erforderlich ist (z.B. auf einer Webseite), sind die Angaben zur Anbieterkennzeichnung dort erneut entsprechend bereit zu halten. Ein Vorlesen der Pflichtangaben bei Aktivierung eines Skills ist derzeit nicht erforderlich; wünschenswert wäre aber ein hörbarer Verweis, wo derartige Informationen zu finden sind, z.B. mit einer Ansage wie: „Mehr Infos unter …“.

Was muss ein Impressum für Amazon Skills bzw. Google Actions beinhalten?

Ein vollständiges Impressum beinhaltet:

  • den Namen (Vor- und Nachname, bei Unternehmen deren Name sowie Name und Vorname der Vertretungsberechtigten)
  • bei juristischen Personen die Rechtsform
  • die Anschrift (Straße, Hausnummer, Postleitzahl und Ort)
  • Kontaktmöglichkeit, in der Regel E-Mail-Adresse und Telefonnummer
  • soweit vorhanden, die Umsatzsteuer-Identifikationsnummer
  • soweit vorhanden, das Handels-, Vereins- oder sonstiges Register mit Registernummer

Stand 10.01.2020

Welche Sprachassistenten gibt es? Marktübersicht.

Angefangen hat alles mit Amazons Alexa und Googles Assistant. Inzwischen gibt es aber eine große Vielzahl am Sprachassistenten und Smartspeakern (was ist der Unterscheid zwischen diesen beiden Begriffen?), auch wenn die beiden gerade genannten mit Abstand am weitesten verbreitet sind (siehe entsprechende Umfragen).

Die zwei Marktführer universeller Sprachassistenten

Amazon Alexa

Sprachassistent:

Alexa

Smartspeaker:

Amazon Echo in verschiedenen Versionen; sowie Integration in Smarte Lautsprecher von Dritt-Herstellern

Weitere Frontend-Geräte:

Smartphone-App, direkte Integration in Geräte von Drittherstellern (z. B. Haushaltsgeräte)

Aktivierung:

„Alexa, …“

Voice App Store:

Ansprache von Voice Apps:

„Alexa, frage (Skill-Name) …“

Markteintritt:

06.11.2014 für Prime-Mitglieder in USA, 23.06.2015 alle Amazon-Kunden, Oktober 2016 für Deutschland 10.000 Stück limitiert und mit Einladungssystem, ab Februar 2017 auch in Deutschland weitgehend frei verfügbar.

Namensbedeutung:

Ein Amazon-Manager (David Limp, Senior Vice President Devices) erzählte, dass man eine Computer wie in der Fernsehserie Star Trek entwickelte (der dort mit „Computer“ angesprochen und aktiviert wird), man aber kein Wort der alltäglichen Sprache zur Aktivierung verwenden wollte. Nach mehreren Test kam man auf Alexa (Vorteil für die Technik: weiche Laute und ein X). Außerdem erinnerte der Name die Entwickler an die Bibliothek von Alexandria, die bedeutendste antike Bibliothek.

Third Party Integration:

Dritte können Voice Apps (Amazon Skills genannt) entwickeln. Benötigt wird ausschließlich ein Amazon-Account, der für den Developer-Bereich angemeldet wird. Voice Apps müssen vom Amazon freigegeben werden, bevor sie öffentlich verfügbar sind.
Zur Dokumentation für Entwickler

Google Assistant

Sprachassistent:

Google Assistant

Smartspeaker:

Google Nest (bis 2019 unter der Bezeichnung Google Home vertrieben) in verschiedenen Versionen; sowie Integration in Smarte Lautsprecher von Dritt-Herstellern

Weitere Frontend-Geräte:

Smartphone-App, direkte Integration in Geräte von Drittherstellern

Aktivierung:

„Ok, Google …“
„Hey, Google …“
(weitere Aktivierungsworte konfigurierbar)

Ansprache von Voice Apps:

„Ok, Google, rede mit (Action-Name) …“

Markteintritt:

Vorgestellt am 18.05.2016 auf Google Entwicklerkonferenz, im November Google Home in USA verfügbar (im Okt. 2017 folgte Google Home Mini). Februar 2017 wurde der Sprachassistenten auf Android-Smartphones ausgeliefert. Er steht mit dem Markteintritt am 08.08.2017 auch in in deutscher Sprache zur Verfügung.

Namensbedeutung:

Die Bezeichnung „Google Assistant“ weißt klar auf den Anbieter sowie auf die Funktion des Sprachassistenten hin.

Third Party Integration:

Dritte können Voice Apps (Google Actions genannt) entwickeln.
Zur Dokumentation für Entwickler

Weitere universelle Sprachassistenten

Samsung Bixby

Sprachassistent:

Bixby

Smartspeaker:

(kein eigener Smartspeaker)

Weitere Frontend-Geräte:

Bixby ist auf den meisten Samsung Smartphones und Tablets verfügbar sowie in Samsung-Geräten wie Samsung-TVs oder Haushaltsgeräte (z.B. Family Line 2.0 Kühlschrank).

Aktivierung:

„Hi Bixby …“,
Bixby-Taste drücken an Smartphones und Tablets von Samsung,
Klick auf Bixby-Symbol auf Samsung-Geräten

Ansprache von Voice Apps:

Keine spezielle Ansprache; Capsules werden automatisch (oder manuell vom Nutzer für sich konfiguriert) passenden Fragen zugeordnet.

Voice App Store:

Bixby Marketplace
Aufruf: Bixby-Taste drücken und nach links wischen.

Markteintritt:

Die Ankündung erfolgte am 20.03.2017, erste Auslieferung war mit dem Smartphone Samsung Galaxy S8 und S8+. Bixby setzt dabei auf die wesentlich einfachere Sprachschnittstelle „S Voice“ auf dem Galaxy S III auf. Bixby ist verfügbar in Deutsch seit dem 20.02.2019.

Namensbedeutung:

(es ist nicht bekannt, weshalb dieser Name von Samsung gewählt wurde; „Bixby“ ist als Kindername keinem bestimmten Geschlecht zugeordnet)

Third Party Integration:

Dritte können Voice Apps (Capsules) entwickeln und Bixby damit neue (eigene) Funktionalitäten hinzufügen.
zum Bixby Developer Portal

Markteintritt:

Namensbedeutung:

möglich mit dem Samsung Developer Kit.

Apple Siri

Sprachassistent:

Siri

Smartspeaker:

Apple HomePod

Weitere Frontend-Geräte:

Smartphone- und Tablet-App (ursprünglich war Siri ausschließlich als App für Smartphone und Tablets verfügbar und wurde erst später mit dem HomePod als eigenständiger Sprachassistent verfügbar), Apple-TV-Geräte, Mac-PCs.

Markteintritt:

Siri wurde von Apple als Produkt am 04.10.2011 präsentiert und war ab dem 14.10.2011 am Markt verfügbar. Ab 09.09.2015 war eine Apple-TV-Steuerung mit Siri möglich. Der Smartspeaker HomePod ist seit dem 09.02.2018 im Markt, Verkaufsstart in Deutschland war der 18.06.2018.

Namensbedeutung:

Siri Inc.“ war der Firmenname des 2007 gegründeten Unternehmens, das 2010 von Apple gekauft wurde. „Siri“ ist ein im skandinavischen Raum verbreiteter weiblicher Vorname und der Gründer von „Siri Inc.“ überlegte, sein Kind so zu benennen (es wurde dann allerdings ein Sohn) und registrierte siri.com – ein Ausgangspunkt für den heutigen Sprachassistenten.

Third Party Integration:

Smartphone-Apps können Sprachsteuerung über Siri integrieren. Eigene Voice Apps von Dritten sind für Siri derzeit nicht möglich.
zur Developer-Dokumentation

Regionale Sprachassistenten

Telekom Magenta (Deutschland)

Sprachassistent:

Magenta

Smartspeaker:

Smartspeaker Magenta
(kein spezieller Name)

Aktivierung:

„Hallo Magenta, …“
„Hey Magenta, …“
„Hi Magenta, …“

Markteintritt:

Vorgestellt im Februar 2018. Verkauf startete am 06.09.2019 zur IFA 2019.

Third Party Integration:

Derzeit keine Integration von Voice Apps oder Software von Dritten möglich.

Sonstiges:

Enge Integration sehr vieler anderer Telekom-Produkte, z. B. Telefonate, MagentaTV, Smarthome, etc.
Der Sprachassistent ist Zusammenarbeit mit Telekom-Unternehmen Orange.
Alexa kann im gleichen Smartspeaker ebenfalls parallel aktiviert werden.

Spezialisierte Sprachassistenten

Die folgenden Sprachassistenten verstehen sich nicht als universelle Sprachassistenten mit breitem Anwendungsbereich, sondern sind auf einen bestimmten Aufgabenbereich spezialisiert.

Microsoft Cortana

Sprachassistent:

Cortana

Spezialisierung:

Von Microsoft positioniert als Sprachbedienung für die Office 365 Produktpalette.

Smartspeaker:

(bisher keiner am Markt)

Weitere Frontend-Geräte:

Cortana ist auf Windows-10-PCs verfügbar sowie als App auf Windows Phone 8.1, iOS- und Android-Geräten sowie der XBox One.

Markteintritt:

Vorgestellt 2014 ist Cortana dann mit dem Markteintritt von Windows 10 ab 29.07.2015 verfügbar.

Namensbedeutung:

Cortana ist eine Hommage an die Figur einer künstlichen Intelligenz, die im der Microsoft Spiele-Serie die Spieler unterstützt.

Third Party Integration:

Dritte können Voice Apps (Cortana Skills genannt) entwickeln.
Zur Dokumentation für Entwickler
Zum Vocie App Store

Geplante / angekündigte Sprachassistenten

Sprachassistent der Deutschen Bahn

Angekündigt ist der Sprachassistent „Semmi“, der insbesondere zu Mobiliätsthemen Auskunft geben soll. Ob Semmi nur eine einfach Sprachsteuerung zur Abfrage von Zuginformationen und Buchung von Fahrkarten sein wird oder die Bezeichnung „Assistent“ wirklich verdient, wird sich noch zeigen müssen, wenn mehr zu dessen Leistungsfähigkeit bekannt wird.

Sprachassistenten von Autoherstellern

Sprachassistent von BMW

Aktivierung:

„Hey BMW …“

Sprachassistent von Mercedes

Sprachassistent:

MBUX Voice Assistant

Aktivierung:

„Hey Mercedes …“

Sprachassistent von Skoda

Sprachassistent:

Laura

Aktivierung:

„Okay Laura …“

Sprachassistent von Volkswagen

Wie funktionieren Sprachassistenten?

Für die Erklärung, wie Sprachassistenten funktionieren, muss erst einmal zwischen den Begriffen Sprachassistent und Smart Speaker unterschieden werden: der eigentliche Sprachassistent ist eine Software im Rechenzentrum des Anbieters (Amazon, Google), während die Smart Speaker die Geräte sind, die häufig in den Haushalten den Zugriff auf diese Sprachassistenten ermöglichen. Sprachassistenten-Systeme funktionieren also als verteilte Systeme.

Wir zeigen Ihnen im Folgenden – nach einem Kurzüberblick – einerseits die grundlegende Funktions-Architektur des Sprachassistenten-Systems und geben danach einen Überblick, wie genau ein Dialog mit Alexa oder den Google Assistant abläuft.

Wie funktionieren Sprachassistenten – kurz gesagt

  1. Aufnahme der Umgebung mit Mikrofonen und Erkennung des Aktivierungswortes (typischerweise ‚Alexa‘ bzw. ‚Ok Google‘)
  2. Prüfung auf lokale Verarbeitbarkeit der Anfrage (eher selten der Fall)
  3. Streaming des nach dem Aktivierungswort Gesagten an die Sprachassistenten-Software in der Cloud des Anbieters
  4. Audio-Verarbeitung (z. B. Trennung Sprache von Hintergrundgeräuschen sowie Worterkennung)
  5. Inhaltliche Analyse: Ermittlung des Intents (der Absicht) und der Slots (der zugehörigen Parameter) im erkannten Text
  6. Ausführung der eigentlichen Verarbeitung (ggf. in einer Voice App: Skill oder Action) und Generierung des Antworttextes bzw. von Smarthome-Steuerbefehlen
  7. Ausgabe der Antwort bzw. Steuerung der Smarthome-Geräte

Soweit die Kurzform. Und jetzt im Folgenden nochmal etwas ausführlicher.

Die Grund-Architektur von Sprachassistenten

Für das Funktionieren von Sprachassistenten gibt es mindestens zwei Orte, an denen es Funktionalitäten geben muss: das Gerät vor Ort und die Software in der Cloud. Oft kommt noch ein dritter Ort hinzu: die Software eines dritten Unternehmen, das Voice Apps (Skills, Actions) betreibt.

Sprachassistenten-Funktion vor Ort

Am Ort der Nutzung von Sprachassistenten gibt es ein Gerät, das die Mensch-Maschine-Schnittstelle zur Verfügung stellt. Das sind oft die Smart-Speaker Amazon Echo oder der Google Home oder auch einfach die Google Assistant App auf einem Smartphone. Es können aber auch andere in Haushaltsgeräte oder in das Auto integrierte Schnittstellen sein. Diese Schnittstellen bestehen im Wesentlichen aus Mikrofonen, Lautsprechern und etwas integrierter Elektronik.

Bildlich gesprochen sind die Smart Speaker und andere Geräte vor Ort die Ohren und Münder der Sprachassistenten.

Sprachassistenten-Funktion in der Cloud

Die wichtigsten Funktionen eines Sprachassistenten finden sich in der Cloud bzw. im Rechenzentrum des jeweiligen Anbieters (bei Alexa in der Amazon Cloud, bei Google Assistant in der Google Cloud). Die Smart Speaker vor Ort benötigen daher immer eine Verbindung zu dieser Cloud-Software, um die eingesprochenen Anfragen dort verarbeiten und Antwort-Dialoge ermitteln zu lassen. Deshalb muss das Gerät vor Ort auch immer mit dem Internet verbunden sein, wenn es genutzt werden soll.

Bildlich gesprochen ist diese Cloud-Software das eigentliche Gehirn des Sprachassistenten, das die Anfragen verarbeitet.

Funktionen in Dritt-Anbieter-Apps

Die Sprachassistenten-Software in der Cloud bietet schließlich Software-Schnittstellen, über die sie Anfragen an die Software Dritterzur dortigen Verarbeitung weiterreichen kann (z. B. durch die eigene Programmierung eines Unternehmens). Diese so genannten Voice Apps werden angesprochen, wenn ein Nutzer „Alexa, frage (App-Name) …“ bzw. „Ok Google, rede mit (App-Name)…“ sagt. Auf diese Weise können Unternehmen eigene Dialoge integrieren, z. B. für Voice Marketing.

Diese Software-Ergänzungen in Form von Voice Apps können entweder auf den eigenen Servern des Voice-App-Anbieters liegen oder in gemietetem Rechnerplatz der Cloud.

Will man im oben begonnenen plaktiven Bild eines Sprachassistenten verbleiben, wären diese Voice Apps Gehirn-Erweiterungen, die diesem neue Funktionen hinzufügen.

Prinzip-Skizze der Funktion von Sprachassistenten (links oben das „Frontend“ Smart Speaker, mittig die zentrale Sprachassistenten-Software mit mitte-unten Voice Apps von Unternehmen).

So funktioniert ein Sprachassistenten-Dialog

Wie läuft ein Dialog mit einem Sprachassistenten ab? Wie funktioniert dieser technisch?

1. Schritt: Aktivierung erkennen

Die Smart Speaker (oder die App auf dem Smartphone bzw. andere Geräte vor Ort) sind nicht dauerhaft mit der Sprachassistenten-Software verbunden. Sie streamen auch nicht laufend und durchgehend alles ins Internet oder zu Amazon/Google, was in ihrer Umgebung zu hören ist.

Die Mikrofone nehmen ihre Umgebung allerdings durchaus laufend auf und leiten diese Aufnahmen an die Elektronik im Gerät vor Ort. Diese prüft, ob das Aktivierungswort (bei Amazon „Alexa“, bei Google „Ok Google“) gefallen ist. Er wenn dieses Aktivierungswort erkannt wurde, startet eine Aufnahme und es folgen die weiteren Schritte inklusive dem Streaming ins Netz.

Ist das Aktivierungswort nicht gefallen, wird die Aufnahme des Mikrofons nach wenigen Sekunden wieder verworfen (gelöscht) und es erfolgt keine weitere Aktivität.

2. Schritt: Prüfung, ob lokale Verarbeitung möglich

Die Elektronik des Smartspeakers prüft jetzt gegebenenfalls, ob eine sehr einfach Anfrage vorliegt, die direkt vor Ort und ohne Verbindung zur Software in der Cloud beantwortet werden kann. Das wäre beispielsweise der Fall, wenn Alexa oder Google Assistant nach Uhrzeit oder Datum gefragt werden.

In frühen Versionen der Smart Speaker gabe es diesen Schritt einer lokalen Verarbeitung überhaupt nicht und selbst einfachste Anfragen wurden (und werden auch heute meist noch) zur Bearbeitung in die Cloud gestreamt. Je moderner die Geräten allerdings werden, desto eher ist doch bereits in der Elektronik vor Ort eine grundlegende Sprach- und Intent-Erkennung integriert, so dass solch einfach Anfragen direkt vor Ort bearbeitet lassen.

3. Schritt: Streaming der Anfrage in die Cloud

War das Aktivierungswort erkannt worden (und die Anfragen kann nicht vor Ort verarbeitet werden – also in den meisten Fällen) wird das Aufgenommene als Audio-Datei über das Internet an die Sprachassistenten-Software in der Cloud des jeweiligen Herstellers geschickt. Deshalb braucht es auch unbedingt eine Internetverbindung per WLAN oder Mobilnetz.

4. Schritt: Verarbeitung der Anfrage im Sprachassistenten

In der eigentlichen Sprachassistenten-Software angekommen beginnt die entscheidende Verarbeitung. Diese besteht aus mehreren Stufen: der Spracherkennung, der Ermittlung des eigentlichen Inhalts der Anfrage und schließlich der Abarbeitung der Anfrage sowie die Ermittlung der auszugebenden Antwort.

4a. Spracherkennung

Aus den durch das Mikrofon aufgenommenen und über das Internet gestreamten Audio-Files müssen jetzt die gesprochenen Worte extrahiert werden. Dazu werden verschiedene Verarbeitungsschritte ausgeführt: die eigentliche Sprachinformation wird vom Hintergrundgeräuschen als auch von Raumhall getrennt (Speech Signal Enhancement, SSE und Beamforming) sowie eine Worterkennung innerhalb des Audiofiles durchgeführt.

Aus den erkannten Worten muss dann im Rahmen in einer weiteren Verarbeitung zum inhaltlichen Verstehen eine Textanalyse durchgeführt werden. Es gilt, diejenigen Worte zu erkennen, die die eigentliche Absicht des Nutzers wiederspiegeln und diese entscheidenden Worte von sonstigen Textteilen zu trennen.

Am Ende der Verarbeitung wurde die konkret Absicht (englisch: Intent) in der Aussage des Nutzers extrahiert sowie ggf. die zu diesem Intent gehörigen Parameter (‚Slots‘ genannt) ermittelt.

Ein Beispiel: Eine Nutzerin sagt „Alexa, wie ist aktuell das Wetter in Hamburg?“ oder sie sagt „Alexa, sag mir das Wetter derzeit in Hamburg?“ – dann ist in beiden Fällen, trotz der unterschiedlichen Formulierung, der gleiche Intent zu erkennen: nämlich das Wetter zu erfahren. Die Slots sind einerseits die Stadt (hier: Hamburg) und andererseits der Zeitraum (hier: zum jetzigen Zeitpunkt).

4c. Abarbeitung der Anfrage & Ermittlung der Antwort

Ist der Intent einmal ermittelt, kann die Anfrage konkret bearbeitet werden. Im Falle des obigen Beispiels würde Alexa bzw. der Google Assistant auf eine Wetter-Datenbank zugreifen und dort die Daten zur aktuellen Wettersituation abrufen. Analog würde das bei anderen Anfragen (Rechenaufgabe, Begriffserklärungen, etc.) erfolgen.

Eine Besonderheit, die gerade für das Marketing mit Sprachassistenten von Bedeutung ist, gibt es an dieser Stelle: sagt der Nutzer „Alexa, frage (App-Name) …“ oder „Ok Google, rede mit (App-Name) …“ so wird die Sprachassistenten-Software die Anfrage nicht direkt selbst bearbeiten. Vielmehr werden der Intent sowie die ggf. zugehörigen Slots an ein externes Programm zur Bearbeitung weiter gereicht: die so genannten Voice Apps (Amazon Skills bzw. Google Actions) übernehmen die Verarbeitung. Unternehmen können auf diese Weise also in eigener Software den Dialog steuern und abarbeiten.

Am Ende der Verarbeitung wird dann üblicherweise ein konkreter Text zusammen gestellt, der als Antwort für Nutzer bzw. Nutzerin gedacht ist, z. B. „In Hamburg scheint derzeit die Sonne bei 24 Grad“. Hat eine Voice App die Anfrage bearbeitet, wird eben dieser Text (für IT-ler: als String) an die Alexa-Software bzw. den den Google Assistant übergeben.

Alternativ oder ergänzend zu einer solchen Sprachantwort – durch den Sprachassistenten direkt ober in einer Voice App – aber auch der Steuerbefehl für ein Smarthome-Gerät entstehen.

4d. Antwort schicken und ausgeben

Liegt das Ergebnis der Verarbeitung einmal fest, muss diesen jetzt nur noch ausgegeben werden. Dazu wird die festgelegte Textantwort an das benutzte Gerät (Amazon Echo, Google Home oder jedes ursprünglich angesprochene Gerät) zurück geschickt und dort über die Lautsprecher ausgegeben.

Ist auch ein Smarthome-Steuerbefehl aus der Verarbeitung hervor gegangen, wird dieser an das betreffende Gerät per Internet (im letzten Schritt meist WLAN) übertragen.

FAQ zur Funktion von Sprachassistenten

Wie funktionieren Sprachassistenten (Kurzform)?

So läuft die Nutzung von Sprachassistenten technisch ab:
1. Warten auf das Aktivierungswort (z.B. „Alexa“, „Hey Google“, …)
2. Streaming des danach gesagten an die Cloud (zur eigentlichen Sprachassistenten-Software, z.B. bei Amazon, Google, …)
3. Audio wird in Text und dann in Steuerbefehle umgesetzt
4. Bearbeitung der Anfrage, a) durch Sprachassistent selbst oder b) Übergabe der Kontrolle an Programmierung einer Voice App
5. Rückgabe des Antworttextes an das Frontent, z.B. den Smartspeaker

Überträgt ein Sprachassistent immer alles Gehörte ins Internet?

Nein. Der Sprachassistent wartet zuerst nur auf das Aktivierungswort (z.B. „Alexa …“ o. „Hey Google …“). Erst danach wird alles Gesagte ins Internet (genauer: zur Sprachassistenten-Software in der Cloud von Amazon, Google, …) übertragen, bis eine längere Sprechpause die Übertragung wieder unterbricht.

Wie kann man eigene Dialoge/Antworten in Sprachassistenten integrieren?

Dazu muss man eine Voice App (Amazon Skill, Google Action …) programmieren. Diese wird mit „Alexa, frage (Voice-App-Name) …“ bzw. „Hey Google, rede mit (Voice-App-Name) …“ angesprochen. Dann hat man mit der eigenen Programmierung die Dialoge des Sprachassistenten unter Kontrolle.

Funktioniert ein Sprachassistenten auch ohne Internet?

Fast gar nicht. Da die Verarbeitung der Sprache des Nutzers sehr aufwändig ist, muss diese in großen Rechenzentren erfolgen, deshalb muss jede Anfrage direkt über das Internet übertragen werden. Ohne Internet kann ein Sprachassistent nur sehr rudimentäre Anfragen (z.B. nach der Uhrzeit) beantworten.

Abgrenzung Content Marketing vs. klassisches Marketing

Was ist Content Marketing (und was ist es nicht)?

Content Marketing ist eine Marketingform, die sich deutlich vom klassischen Marketing (und erste recht von vertrieblichen Aktivitäten) unterscheidet. Ein wesentlicher Unterschied ist die inhaltliche Ausrichtung: während klassisches Marketing sich um das eigene Produkt, die Marke oder das Unternehmen dreht, bietet Content Marketing nicht-werbliche Inhalte, die sich um die Interessen des Kunden drehen. Während also klassisches Marketing den Nutzen eines Produkts für den Kunden aufzeigt, ist Content Marketing redaktionell-journalistisch getrieben und informiert, hilft weiter oder unterhält den Kunden einfach.

Content Marketing ist also nicht vom Unternehmen, seinen Produkten und Marken her gedacht, sondern geht vom Kunden (bzw. auch Noch-Nicht-Kunden der Zielgruppe) und deren Interessen aus.

Klassisches Marketing vs. Content Marketing – die Unterschiede

Lässt sich der Unterschied zwischen dem strategischen Ansatz des Content Marketings und dem klassischen Marketing an bestimmten Kriterien festmachen? Ja. Die folgende Tabelle gibt einen schnellen Überblick über wichtige Unterschiede zwischen beiden wieder.

Klassisches MarketingContent Marketing
MarketingstrategiePushPull
Botschaftenwerblichekundenorientiert
RelevanzfokusProduktnutzenThemen-, Problem-Relevanz
ZielDirekter o. indirekter VerkaufKundenzufriedenheit,
Image, Kundenbindung,
Kaufentscheidungs-
vorbereitung
TaktikDirekter Verkaufsappell,
positive Darstellung des
beworbenen Produkts,
Imagedarstellungen
Redaktionell-journalistisch
InhalteProdukt-, Marken-
und Unternehmensbezogen
Informative, hilfreicher,
unterhaltende Inhalte
Werbewirkung
(psychologisch)
Erzeugung von Einstellungen,
die zu einer Kaufabsicht
führen
Erzeugung von
Einstellungen als
Ausgangspunkt einer
besseren Wirkung
späterer Marketing-
maßnahmen

Verwendung der Tabelle nur mit schriftlicher Genehmigung. Quelle:
Hörner, Th. (2019): Marketing mit Sprachassistenten. So setzen Sie Alexa, Google Assistant & Co. strategisch erfolgreich ein. Wiesbaden: Springer Gabler.
Für Zitationen der Tabelle in wissenschaftlichen Arbeiten bitte dieses Buch verwenden.

Nicht jeder Content ist Content Marketing!

Es ist ein weit verbreitete Missverständnis: wer mehr Inhalte auf seine Website setzt (oder diese verbessert und umfangreicher macht) würde Content Marketing betreiben. das ist nicht der Fall. So sind Produktbeschreibungen, Bilder von Produkten (ggfls. auch in Nutzungssituationen) oder eine ausführliche Darstellung der Unternehmensphilosopie zwar Inhalt (eng. Content), aber längst kein Content Marketing. Denn diese Inhalte sind auf das Unternehmen und seine Produkte direkt bezogen und sollen diese in einem möglichst positiven Licht erscheinen lassen. Das ist durchaus berechtigt, sinnvoll und auch notwendig – aber eben kein Content Marketing.

Tipps für Hausmittel gegen Pflanzenschädlinge (auf der Website eines Gartenbedarfshändlers), wichtiges Wissen zu einem effektivem Lauftraining (z. B. auf einer Sportanbieter-Website oder in einem Social Media Kanal) oder auch ein Promi-Klatsch bei einem dazu passenden Modehändler sind dagegen sinnvolle Content Marketing Inhalte. Auch eine Checkliste, die bei der Auswahl des richtigen Bratpfannen-Typs hilft, würde darunter fallen – solange diese redaktionell und unabhängig vom eigenen Sortiment wäre (ansonsten wäre sie Produktberatung des klassischen Marketings).

Dürfen Produkte oder Unternehmen im Content Marketing vorkommen?

Nach den obigen Darstellungen könnte man denken, jeder Inhalt (Content) rund um die eigenen Produkte oder über das Unternehmen könnten niemals Content Marketing sein. Aber auch das ist nicht korrekt. Die eigenen Produkte, die Marke und auch das Unternehmen dürfen in Content Marketing Inhalten durchaus vorkommen, allerdings ist für die Einordnung entscheidend, ob und wie der jeweilige Inhalt ausgerichtet ist: werblich oder nicht-werblich bzw. redaktionell-journalistisch. Entscheidend ist also nicht das Thema, sondern der Stil der Umsetzung. Zwei Beispiele sollen das deutlich machen:

Beispiel 1: Ein Händler Mode, z. B. eine rote Damenbluse. Auf seiner Website zeigt er, mit welchen anderen Modestücken sich diese Damenbluse optisch gut kombinieren lässt. Alleine mit dieser Information lässt sich aber noch nicht sagen, ob es sich um Content Marketing handelt oder nicht. Würde beispielsweise für Stil-Empfehlungen ausschließlich auf andere Produkte in diesem Webshop verwiesen im Sinne eines „dieses andere Produkt passt hierzu“, dann läge ein klassisches Cross-Selling vor, also eine klassische Marketingmaßnahme. Würde aber in einem Blogbeitrag (oder auf der Produktseite selbst) ein redaktionell-journalistischer Styleguide für diese rote Bluse finden zu sein, die ganz allgemeine Modeempfehlungen zu dieser Bluse gibt (und eben nicht nur bezüglicher anderer Webshop-Produkte), dann wäre das als Content Marketing einzuordnen.

Beispiel 2: Ein Mitarbeiter wird vorgestellt. Erfolgt dies beispielsweise im Stil einer journalistischen Reportage und die Person selbst steht im Mittelpunkt, ist das natürlich Content Marketing (auch wenn in der Reportage natürlich gesagt wird, wo dieser Mitarbeiter beschäftigt ist und was er tut). Ist die Mitarbeiter-Vorstellung allerdings nur sehr kurz (z. B. Bild der Callcenter-Mitarbeiterin und ein Satz „Rufen Sie mich an, ich helfe Ihnen“) oder liegt der Schwerpunkt der Mitarbeitervorstellung darin zu sagen, was diese für ein Produkt beiträgt und wie sie die Qualität sichert – dann ist der Inhalt wieder klar werblich und nicht mehr als Content Marketing einzustufen.

Wie geht Content Marketing auf Sprachassistenten?

Content Marketing ist eine grundlegende Strategie (eine grundlegende Herangehensweise) und kann deshalb in vielen Onlinemarketing-Instrumenten angewendet werden: Website und Blog, Facebook und Instagram, Newsletter und andere. Und eben auch: auf Sprachassistenten. Dort nennt sich die Teildiziplin dann Voice Content Marketing (VCM).

Auf Alexa, Google Assistant und Co bekommt die Marketingstrategie des Content Marketings sogar eine zentrale Bedeutung. Woran das liegt zeigt der Beitrag „Wie Content Marketing zu seiner Rolle kam“.

Content Marketing Ziele

Die Folge aus all dem bisher gesagten: Verkauf oder Umsatz können kein Ziel des Content Marketings sein, denn weder werden Produkte dargestellt noch über deren Produktnutzen gesprochen. Vielmehr geht es bei Content Marketing darum, Aufmerksamkeit zu bekommen, Kompetenz zu zeigen, uneigennützigen Service zu bieten sowie Interessenten wie Kunden zu binden.

Nichtsdestotrotz wirkt Content Marketing natürlich trotzdem positiv auf den Geschäftserfolg und mittel-/langfristig auf den Umsatz – sonst wäre es ja keine sinnvolle Marketing-Maßnahme. Dies sind aber keine direkten Ziele, sondern lediglich indirekt erreichte (wenn auch natürlich gewünschte) Effekte.

Taktische Teilbereiche des Content Marketings

Content Marketing ist, wie aus den vorstehenden Ausführungen hervorgeht, kein einzelnes Marketing-Instrument, sondern eine Marketingstrategie, die in Form von Inhalten verschiedener Marketinginstrumente und -methoden realisiert wird. Daraus ergeben sich auch verschiedene taktische Teilbereiche des Content Marketings.

Social Media Content Marketing (SMCM)

Das Social Media Content Marketing realisiert den strategischen Ansatz des Content Marketings in Social Media Kanälen. Es überschneidet sich daher mit Social Media Marketing (ist ein Teil dessen).

Voice Content Marketing (VCM)

Werden Inhalte im Rahmen von Content Marketing Strategien sprachlich auf Sprachassistenten (z. B. Amazon Alexa, Google Assistant) angeboten, so spricht man von Voice Content Marketing. Diese spielt im Rahmen von Voice Marketing auf Sprachassistenten sogar eine wichtige Rolle, da viele Inhalte von Voice Apps stark auf Content Marketing strategischer Sicht realisiert werden (sollten).

Studien & Statistiken zu Sprachassistenten – Nutzung, Marktanteile, Marktführer, Aussichten

Der Markt der Sprachassistenten ist sehr dynamisch. Laufend ändern sich die Zahlen, eine Studie nach der anderen erscheint. Immer aktuelle Zahlen zu haben, ist aufwändig und schwierig. Wir können hier nicht garantieren, immer die aktuellsten (und auch nicht alle wirklich existierenden) Studien und Marktzahlen zu Alexa, Google Assistant und Co. haben. Aber wir wollen versuchen, ihnen im Folgenden eine erste hilfreiche Übersicht zu bieten (beachten Sie auch unsere Auswahl an Fachliteratur und Artikeln zu diesem Thema).

Aktuelle Studien-Neueinträge erfahren? Einfach Facebook-Seite „Marketing mit Sprachassistenten“ oder Thomas Hörner auf LinkedIn folgen.

Hinweis: wir nehmen hier bevorzugt Studien auf, die entweder repräsentativ sind oder zumindest hohe Ansprüche an Studiendesign und -durchführung einhalten bzw. die Grundlagen empirischer Forschung einhalten.

Deutschland Marktstudien Sprachassistenten

Beyto Smart Speaker Studie 2020 (beyto.com)

Neue Ausgabe der bereits 2019 durchgeführten Studie zur Smartspeaker-Nutzung, die repräsentativ für die deutsche Bevölkerung ist. Ausgesuchte Ergebnisse:

  • Inzwischen besetzt jede/r vierte Deutsche mind. einen Smartspeaker (24%) – bei den über 55-jährigen immerhin gut jeder Fünfte (18%), bis 34 Jahre jeder Dritte (34%).
  • Wer einen hat, weiß, lernt auch den Nutzen kennen: Der Aussage, Smartspeaker seinen eine technische Spielerei stimmt 60% der Nicht-Besitzer zu, aber nur 44% der Besitzer (die Höhe zeigt aber, dass der Nutzen dieser Geräte immer noch nicht ausreichend erschlossen oder bekannt ist)
  • Speaker stehen im Wohnzimmer (75%), Küche (52%) Schlafzimmer (47%), … (mehr in der Studie)
  • Die Nutzung von Voice Apps hat leicht zugenommen und Besitzer mehrere Smart Speaker nutzen diese auch häufiger. Jeder Dritte (33%) sucht aktiv danach, jeder Vierte (24%) werden durch Werbung darauf aufmerksam.
  • Besonders interessant (insb. für Voice App-Anbieter): der Hauptgrund, KEINE Voice App zu nutzen, ist „zu wenig Information darüber“ (52%), während „schlechte Qualität“ nur bei 16% der Grund für Nicht-Nutzung ist

Befragt wurden 2.042 Personen im März 2020 mittels Online-Umfrage. Diese wurden repräsentativ für die Deutsche Bevölkerung ab 18 Jahren ausgewählt.

Die Studie mit weiteren Statistiken kann im Internet kostenlos heruntergeladen werden.

E-Commerce Trends 2020 (idealo.de)

Studie zu E-Commerce / Online-Shopping. Darin enthalten auch mehrere Fragen zu Sprachassistenten. Zentrale Ergebnisse:

  • 26% der Befragten besitzen ein Smart Home Gerät (Vorjahr 17%), 57% haben schon Sprachassistenten auf Smartphones genutzt.
  • Hauptverwendung sind Informationen abrufen (57%), Musik hören (46%), Telefonieren/Nachrichten schreiben (32%), Smart-Home-Anwendungen (27%) sowie Preise vergleichen (24%) und Produkte bestellen (19%)
  • Gegen die Nutzung von Sprachassistenten spricht die einfachere Bedienung von Bildschirmen (39%), Angst vor versehentlichen Bestellungen (34%) oder der Befrafte möchte nicht, dass jemand mithört (34%), …

Befragt wurden 1.076 Studienteilnehmer in einer Online-Befragung. Die Studie ist laut Studienersteller repräsentativ für Online-Shopper in Deutschland (die %-Zahlen oben müssen daher als Anteil von Online-Shoppern, nicht von der Gesamtbevölkerung in Deutschland verstanden werden; die Online-Shopper wurden unabhängig von Idealo als Auftraggeber ausgewählt). Die Studie kann kostenfrei heruntergeladen werden.

Global Mobile Customer Survey 2019 (Deloitte)

Die Studie beschäftigt sich vorwiegend mit dem Mobilfunkmarkt bzw. der Smartphonenutzung, hat aber einen eigenen Abschnitt zu Sprachassistenten. Einige ausgesuchte Ergebnisse:

  • Die Nutzerzahl der Sprachassistenten hat sich (altersübergreifend) innerhalb eines Jahres verdoppelt auf 30% der Deutschen.
  • Jeder Zweite (51%) in der Altersklasse 18-24 Jahre nutzt inzwischen Sprachassistenten, selbst bei den 55-64-Jährigen ist es jeder Fünfte (21%).
  • Einkäufe per Sprachassistent (Voice Commerce) nutzt nur grob jeder Siebte (17%) – aber auch diese Zahl ist um 50% gesteigen seit 2018.

Für die Studie wurden weltweit 44.000 Mobilfunknutzer (die obigen %-Zahlen sind daher als Anteil der Mobilfunknutzer, nicht der Gesamtbevölkerung zu interpretieren) in 28 Ländern befragt, davon in Deutschland (für die die oben genannten Zahlen gelten) 2.000 Online-Interviews im Spätsommer 2019.

Einsehbar sind die zentralen Studienergebnisse online und es ist dort auch ein kostenfreier Download verfügbar.

GfK-Studie (im Auftrag von Mastercard)

Ausgesuchte Ergebnisse:

  • 34% der deutschen Internetnutzer setzen bereits Sprachassistenten ein, weitere 14,8% planen dies
  • Sprachsteuerung wird sehr häufig im Auto (28,6%), im Bett (16,7%), in der Küche (14,7%) oder Unterwegs (12,7%) genutzt
  • Vorwiegend werden Nachrichten/Wetter/Verkehr abgerufen (47,3%), es werden Wissensfragen gestellt (38,5%), das Navigationsgerät angesprochen (38,2%) oder Entertainment-Inhalte abgerufen (ca. 28%).
  • Jeder Vierte (26%) kann sich vorstellen, auch über Sprachassistenten zu kaufen, jeder Zehnte hat das schon einmal getan.

Befragt wurde eine bevölkerungs-repräsentative Stichprobe von 1008 Befragten im Alter von 18-74 Jahren. Informationen zur GfK-Studie finden sich in der Pressemeldung von Mastercard.

Postbank Jugend-Digitalstudie 2019

Studien zur Nutzung digitaler Medien (u. a. auch Sprachassistenten) durch Jugendliche. Ausgesuchte Ergebnisse:

  • 1,7 Std. wöchentlich (= täglich 0,3 Std.) verbringen Jugendliche von 16-18 Jahre durchschnittlich mit Sprachassistenten.
  • Jeder Fünfte (21%) der 16-18-Jährigen hat einen Sprachassistenten zu Hause stehen.

Befragt wurden für die Studie 1.004 repräsentative Jugendliche im Alter von 16-18 Jahren. Zur Pressemeldung mit Infografik.

Smart Speaker Studie 2019. beyto

Befragung von ca. 1.500 volljährigen Deutschen, die in Facebook und anderen Social Media erreicht wurden (Zeitraum Frühjahr 2019). Einige ausgesucht Ergebnisse:

  • 38% der Befragten besitzen KEINEN Smartspeaker, 10% aber immerhin 3 Stück – am meisten Amazon-Geräte (das heißt auch: 2 von drei Social Media / Facebook Nutzern haben einen Smartspeaker). Die meisten Befragten sind in Unternehmen angestellt (ca. 50%) und nutzen Smartspeaker zu einem großen Teil täglich.
  • 75% der Befragten haben Smartspeaker im Wohnzimmer stehen, jeder Fünfte im Bad oder Arbeitszimmer und jeder Zehnte in Ess- oder Kinderzimmer.
  • Voice Apps (Alexa Skills / Google Actions) werden von den meisten Smartspeaker-Besitzern genutzt, allerdings am meisten für Smarthome-Steuerung. Shopping & Lifestyle, Bildung, Reisen oder Essen & Trinken liegen im unteren bis mittleren einstelligen Prozentbereich.
  • 13% der Befragten haben auch schon einmal etwas über Smartspeaker gekauft.

Die Studien mit diesen und weiteren Zahlen kann kostenfrei heruntergeladen werden bei beyto (Angabe Name und E-Mail-Adresse notwendig für Zusendung Download-Link).

Smart Talk. Capgemini (2019)
How organisations and consumers are embracing voice and chat assistants

Befragung von 12.000 Konsumenten in mehreren Ländern sowie 1000 Unternehmensverantwortlichen zu Nutzung und Nutzen von Sprachassistenten. Einige ausgesuchte Ergebnisse:

  • Nutzen für Unternehmen:
    60% der führenden Unternehmen, haben eine erhöhte Mitarbeiterzufriedenheit durch Einsatz von Sprachassistenten erreicht, 40% berichten von reduzierten Kosten im Kundenservice (um mehr als 30%), und 34% geben eine reduzierte Kundenabwanderung als Nutzen der Sprachasssistenten an.
  • bei 40% der heutigen Sprachassistenten-Nutzer liegt die erste Nutzung nicht mehr als 1 Jahr zurück.
  • 54% der Konsumenten vertrauen Produktempfehlungen durch Sprachassistenten
  • Gute Erfahrungen mit Voice/Chat-Assistants führt bei 72% der Konsumenten zu mehr Vertrauen in das Unternehmen, 71% haben diese positive Erfahrung mit Freunden und Familien geteilt und 64% haben über gute Erfahrungen positiv bewertet oder positiv in Social Media kommuniziert.
  • Studiendesign: befragt wurden 12.000 Konsumenten, die Sprachassistenten oder Chatbot (oder beides) genutzt hatten sowie 1000 Executives in Unternehmen.

Die 44-seitige Studie kann kostenfrei bei Capgemini heruntergeladen werden.


Das Buch zum Thema

Marketing mit Sprachassistenten
So setzen Sie Alexa, Google Assistant & Co strategisches erfolgreich ein.

Buch bei Amazon oder beim SpringerGabler Verlag ansehen

Inhaltsverzeichnis ansehen


Postbank Digitalstudie 2019

Untersuchung zur Internet- und Mobilnutzung der deutschen Bevölkerung. Schwerpunkt der Studie ist die Frage nach der wöchentlichen Nutzungszeit von Internet, Mobile und anderen Geräte, aufgesplittet nach deutschen Bundesländern.

  • Nutzung von Sprachassistenten hat spürbar zugenommen. 32% der befragten Deutschen nutzen einen Sprachassistenten (über Smart Speaker oder auf Handy/Tablet; Alexa, Google Assistant, Siri). 10% sind es, die mit Sprachassistenten Alexa und Google Assistant in Form der Geräte (Smart Speaker) sprechen (Vorjahr noch 5%).
  • Studiendesign: 3.126 Teilnehmer/innen aus Deutschland. Bevölkerungsrepräsentative Befragung im Zeitraum März 2019.

Pressemeldung zur Studie mit Infografik.

Digitale Sprachassistenten – eine repräsentative Umfrage. Splendid Research (2019).

Befragung, u.a. zu Bekanntheit digitaler Sprachassistenten, zu deren Nutzung, Gründe für bzw. gegen die Anschaffung, Ausgaben und Preisbereitschaft, Kaufwahrscheinlichkeiten und Marktpotentiale. Ausgesuchte Studienergebnisse sind:

  • 70% der Befragten wissen, was Sprachassistenten sind. Je 13% nutzen Amazons Echo oder Google Assistant, 6% Apples HomePod.
  • Smartspeaker werden vorwiegend genutzt, um aktuelle Nachrichten vorzulesen (53%), Musik/Hörspiele zu streamen (52%), Informationen im Internet zu suchen (51%) oder Radio zu hören (50%) – alle weitern Gründe 28% oder weniger.
  • Keine Nutzung erfolgt, da keine sinnvoll Anwendungsmöglichkeit (61%), Datenschutzbedenken (35%), zu hohen Kosten (26%) sowie weiteren in der Studien genannten Gründen.
  • Im Durchschnitt wären die Befragten bereit, 115 € für einen Smartspeaker auszugeben (gegenüber € 78 in 2017).
  • Studiendesign: 1.006 Befragte. Bevölkerungsrepräsentative Quotenstichprobe. Erhebungszeitraum 16.01.2019 bis 21.01.2019.

Die Studie ist kostenfrei online erhältlich bei SPLENDID RESEARCH GmbH. Kostenpflichtig dort auch komplette Excel- oder SSPS-Datensätze oder als umfangreicher Tabellenband.

Smart Speaker & Voice Control 2019. Nordlight Research (2019).

Ausgesucht Studienergebnisse:

  • 15% der Deutschen besitzen einen Smartspeaker.
  • Gründe gegen eine Anschaffung sind nicht vorhandener Bedarf (59%), Angst vor Überwachung (52%) oder weitere in der Studie genannte Gründe.
  • Meistgenutzte Smartspeaker sind Amazon Echo / Alexa (68%), Google Home (22%), Apple HomePod (5%).
  • Am meisten werden die Geräte genutzt zur Wiedergabe von Musik (57%), Abfrage von Wetter (55%), Suchmaschinen-Abfragen (46%), Steuerung von Medien (30%) oder für Spiele (28%).
  • Studiendesign: 517 Befragte (nach Qualitätsprüfung). Deutschsprachige Verbraucher mit Internetzugang 16-70 Jahre. Durchgeführt als Vertiefungsbefragung zum Trendmonitor Deutschland 4. Quartal 2018.

Studie ist für € 498,- erhältlich als PDF. Auch mit Excel oder individuelle Analyse erhältlich.

Zukunft der Consumer Technology – Marktentwicklung, Trends, Mediennutzung, Technologien, Geschäftsmodelle. Bitkom Research, Deloitte (2018).

Studien enthält Umfrage-Ergebnisse zu verschiedensten Themen der Consumer Technologie. Ein Kapitel beschäftigt sich auch mit Sprachassistenten. Ausgesucht Studienergebnisse sind:

  • 13% der Befragten nutzen bereits Sprachassistenten, 4% planen Anschaffung innerhalb 12 Monaten, 13% können sich das zumindest vorstellen
  • Hauptnutzung durch die Besitzer von Sprachassistenten ist Geräte im Haushalt steuern (70%), Musik abspielen / Radio hören (69%), Abfahrtszeiten Busse/Bahnen (34%), Verkehrsnachrichten (32%), Sportergebnisse (27%), Kalendereinträge (24%), Suchmaschinen abfragen (21%), E-Mails/Kurznachrichten (15%).
  • 58% der an Sprachassistenten Uninteressierten sorgen sich um Ihre Daten, 57% haben Angst, dass Dritte sie abhören, 56% brauchen sie nicht, 30% ist die Rechtslage zu unsicher, 25% wollen Geräte nicht mit Sprache steuern und 7% ist der Preis zu hoch.
  • Studiendesign: Teilstudie „Smart Home 2018“. 1.611 Befragte. Deutschsprachige Bevölkerung ab 18 Jahren. Erhebungszeitraum 18.-20. KW 2018.

Bei der Bitkom kann die Studie kostenfrei heruntergeladen werden.

Conversational Commerce. Capgemini (2018)
Why Consumers Are Embracing Voice Assistants in Their Lives

Umfangreiche Studie zur Marktentwicklung und Nutzung von Sprachassistenten. Ausgesuchte Ergebnisse:

  • Sprachassistenten-Nutzer sind zu 28% 33-45 Jahre als, zu 25% im Alter von 22-32 Jahre und zu 25% im Alter von 46-60.
  • Interesse am Kauf von … Essen bestellen 56%, andere Services (Taxi, …) 54%, Elektronikprodukte 52%, …
  • Warum Nutzer Sprachassistenten einer Website oder App vorziehen: 52% finden es „more convenient“, 48% „allows multi-task and hands free“, 41% hilft es, Routinen zu automatisieren, …
  • Warum Nutzer Sprachassistenten einen persönlichen Kontakt vorziehen: für 49% ist es schneller, 47% finde es „more convenient“, 41% sehen größere Auswahl, …
  • Studiendesign: 5000 Konsumenten in US (2.021), UK (1.003), Frankreich (1.007) und Deutschland (1.010). Quantitative Befragung ergänzt durch vier Fokusgruppen-Diskussionen (eine je Land) mit je 8-10 Konsumente je Fokusgruppe.

Die 36-seitige Studie kann kostenfrei heruntergeladen werden bei Capgemini.

Digitale Sprachassistenten – eine repräsentative Umfrage. Splendid Research (2017).

HINWEIS: es existiert eine neuere Version dieser Studie aus 2019 (siehe oben)

Befragung, u.a. zu Bekanntheit digitaler Sprachassistenten, zu deren Nutzung, Gründe für bzw. gegen die Anschaffung, Ausgaben und Preisbereitschaft, Kaufwahrscheinlichkeiten und Marktpotentiale. Ausgesuchte Studienergebnisse sind:

  • 70% der Befragten wissen, was Sprachassistenten sind. 15% nutzen den Google Assistant, 15% Apples Siri, 8% Amazon Echo / Alexa. Bei Nicht-Nutzern am bekanntesten ist Amazon (80%), Siri (55%) und der Google Assistant (45%).
  • Anschaffungsgründe waren: Vorinstallation auf Smartphone (53,5%), Interesse an Technologie/Konzept (21,9%), Unterhaltung (18,0%), Tippen dauert zu lange (17,8%) oder ist zu anstrengend (12,3%) sowie weitere in der Studien genannte Gründe.
  • Keine Nutzung erfolgt, da keine sinnvoll Anwendungsmöglichkeit (52,6%), Datenschutzbedenken (25,4%), zu hohen Kosten (22,6%) sowie weiteren in der Studien genannten Gründen.
  • Im Durchschnitt wären die Befragten bereit, 78 € für einen Smartspeaker auszugeben.
  • Studiendesign: 1.024 Befragte. Bevölkerungsrepräsentative Quotenstichprobe. Erhebungszeitraum 23.10.2017 bis 02.11.2017.

Branchenspezifischer Studien

Voice on the go. How can auto manufacturers provide a superior in-car voice experience? (Capgemini, 2019)

Studie zur Nutzung von Voice in Automobilen, zu denen sowohl Management als auch Konsumenten befragt wurden.

  • 95% der Konsumente erwarten, dass sie innerhalb der nächsten 3 Jahre Sprachassistenten im Auto nutzen werden.
  • Wenn Nutzer gute Erfahrunge mit den Sprachassistenten gemacht haben, nutzen Sie in der Folge diese öfter (76%), geben sie diese positiven Erfahrungen in Freundes- und Familienkreis weiter (73%) oder nutzen den Kundeservice weniger und verlassen sich auf den Sprachassistenten (63%).
  • 37% der Befragten sind bereit, für Premiumfunktionen zu bezahlen.
  • Studiendesign: Befragt wurden 300 Manager großer Automobilunternehmen sowie 7.078 Konsumenten, die In-Car-Voice-Systeme nutzen. Befragungszeitraum war April-Mai 2019.

Die Studienergebnisse sind online kostenfrei verfügbar.

Next-Generation Automotive Infotainment, ABIresearch (2019)

  • Bis 2023 werden 20 Millionen Fahrzeuge vorausgerüstet für einen oder mehrere Sprachassistenten (Alexa, Google, Assistant, Siri) ausgeliefert worden sein.
  • Studiendesign: unbekannt.

Die Studie (48 Seiten) ist kostenpflichtig. Preise öffentlich nicht bekannt. Pressemeldung und Inhaltsverzeichnis online verfügbar.

Internationale Studien zu Sprachassistenten

Selligent Global Connected Consumer Index 2019

Studie zum Verhalten von Konsumenten in digitalen Medien (z. B. zu Personalisierung, Social Media, Erwartungen an Kundenservice, etc.). In diesem Zusammenhang auch Ergebnisse zu Voice:

  • 45% der Befragten (41% nur Deutschland) nutzen Sprachassistenten
  • Jeder zweite Nutzer befürchtet, das der Sprachassistent ohne Einwilligung zuhört (jüngere Befragte noch stärker als ältere Befragte)

Befragt wurden in der Studie 5.000 Konsumente (je zur Hälfte weiblich/männlich). 56% davon in Europa (Belgien, Deutschland, Frankreich, Großbritannien, Italien, Niederlande, Spanien) und 44% in Nordamerika. Die Studie kann kostenlose heruntergeladen werden bei Selligent.

Global Digital Voice Assistants Market Size, Status and Forecast 2019-2025, ICT Media / QY Research 2019

Internationale Marktstudien zu Voice Assistants. Umfassende weltweite Markterhebung und Marktprognose.

  • Überblick weltweit angebotener Sprachassistenten
  • Markt-Wachstumstrends und Marktanteile
  • Marktbetrachtungen United States, Europa, China, Japan, Südostasien, Indien, Zentral-/Südamerika
  • Darstellung der zentralen Anbieter
  • Market Forecast

Mehr zur Studie und vollständiges Inhaltsverzeichnis.
Die Studie ist kostenpflichtig ($ 3.600). Ein kostenfreier Auszug ist aber erhältlich.

The State of Digital Lifestyle. Limelight 2019

Keine Studie spezielle zu Sprachassistenten, sondern allgemein zu digitalem Lifestyle. Einige ausgesuchte Studienergebnisse zum Thema Sprachassistenten:

  • 16% aller Sprachassistenten-Nutzer könnten nicht auf deren Nutzung verzichten (in Deutschland 12,3%), je etwas jede/r Fünfte könnte für eine Tag oder eine Woche (aber eben nicht länger) darauf verzichten – je jünger die Befragten, desto kürzer der Zeiraum (genaue Zahlen nach Land unter unten stehendem Link)
  • 26,6% der Deutschen besitzen einen Sprachassistenten (wie Amazon Echo, Google Home, Apple HomePod). Weitere 18% planen einen Kauf innerhalb der nächsten 6 Monate, weitere 15% innerhalb 1-2 Jahren.
  • Aber nur ca. 30% der Deutschen Nutzer vertrauen den Sprachassistenten.
  • Studiendesign: Befragung von 4.500 Konsumenten (je 500 Konsumenten aus Deutschland, Frankreich, Großbritannien, Indien, Italien, Japan, Singapur, Südkorea und den USA). Umfragezeitraum: 12.-29. Mai 2019.

Die Studien-Ergebnisse finden sich online und als Download auf der Website von Limelight.

Voice Search Readiness Report, Uberall 2019

Zweiteilige Studie aus den USA: einerseits Auswertung von 73.000 Online-Einträgen zu lokalen Anbietern, inwiefern diese bereits für Voice Search geeignet sind, andererseits Befragung von 1.007 Konsumenten. Ausgesuchte Ergebnisse:

  • Online-Unternehmensprofile sind im Schnitt nur zu 44% Voice Search geeignet. Am besten schnitten z.B. Zahnärzte, Reformhäuser, Heimwerkerbedarf ab, zu den schlechtesten gehörten Verbraucherschutz-Organisationen, Kongressvertreter, Kunstgalerien und Hochzeitsservices.
  • Von den Befragten Konsumenten hat jeder Zehnte täglich Sprachassistenten genutzt (9,8%), ähnlich viele zumindest wöchentlich (11%). Etwas über die Hälfte nutzt Sprachassistenten gar nicht (57,2%).
  • Gut 60% der Befragten erwarten aber, dass Sprachassistenten in Zukunft wichtig werden.
  • Jeder Vierte (23,2%) nutzt Sprachassistenten nicht, weil er es nicht gewohnt ist, 19,2% weil sie es nicht für effizient halten.
  • Studiendesign: Automatisierte Auswertung von 73.000 Unternehmenseinträgen aus den USA plus Befragung von 1.007 US-Konsumenten zu deren Nutzungsverhalten.

Der Voice Search Readiness Report kann kostenfrei bei Uberall heruntergeladen werden.

Voice Report, Microsoft 2019

Eine Studie von Microsoft, die teils für Smartspeaker, teils allgemeiner für Sprachassistenten Umfragedaten aus englischsprachen Ländern bzw. teils speziell von US-Konsumenten liefert.

  • 35% der befragten nutzen einen digitalen Assistenten über Smartspeaker
  • 72% nutzen die Assistenten für eine Sprachsuche, 52% nutzt auch Voice Apps (Skills oder Actions), 36% steuern Haushaltsgeräte
  • 59% der Besitzer von Smartspeakern haben ein Gerät, 30% haben zwei, 9% drei, 2% vier und 1% fünf oder mehr Geräte in ihrem Besitz
  • Studiendesign: Marktstudie als Onlineumfrage mit 2000 Teilnehmern aus den Ländern US, UK, CA, AU und IN sowie Nutzerbefragung von 5000 US-Konsumenten.

Die Studienergebnisse können hier bei Microsoft kostenfrei heruntergeladen werden.


Sie kennen eine aktuelle, interessante Studie zu Sprachassistenten? Dann schicken Sie uns gerne eine Nachricht an info@sprachassistenten.marketing und wir prüfen, ob diese den Voraussetzungen für eine Aufnahme hier entspricht.