Hey Siri!
Mit dem Apple iPhone 4S wurde auch Siri ein ständiger Begleiter jedes Apple Users. Die Spracherkennungssoftware soll uns den Alltag erleichtern, einfache Fragen beantworten, uns den Wecker stellen und an Termine erinnern. Als 2011 das neue Modell released wurde, spielte sie also die Hauptrolle und fand bei einer breiten Masse Anklang. Neue Technologie ist immer aufregend, trotzdem war und ist Spracherkennung auch bis heute nicht viel mehr als ein Gimmick. Denn anders als ein menschlicher Gesprächspartner, versteht Siri die Worte die du sprichst, dich jedoch nicht. Warum macht Apple, Xbox, Amazon oder Google seine kleinen Helfer also nicht menschlicher?
Aus dem einfachen Grund, dass es sonst ins Uncanny Valley rutschen würde. Denn im Moment sitzen diese AI’s am Rande der Klippe ins dunkle Tal. Um mit unseren Geräten wie mit einem Menschen sprechen zu können, muss es eine ganze Menge mehr von uns lernen und wissen. Es muss jedes gesprochene Wort einfangen und Informationen über seinen User sammeln. Dies würde aber auch das Abrutschen ins Tal, und damit einen langen Prozess des gewohnt werdens bedeuten. Es ist nicht ausgeschlossen, dass das richtige Device, mit der richtigen Stimme und den entsprechenden Benifits es schaffen würde in den Alltag integriert zu werden. Denkt man jedoch an die derzeitige Privacy Situation, wäre es ein weiterer, riesiger Schritt über den gläsernen Menschen hinaus. Ohne einen triftigen Grund, gibt niemand gern sein Privatleben preis. Wer weiß was mit seinen persönlichen Daten passieren würde.
Wie bleibt Spracherkennung eindeutig ein Computer?
- Stimme
Die Stimme der Spracherkennungssoftware ist essenziell für eine angenehme Experience. Ist sie zu menschlich verschwindet das gesamte Gerät im Valley. Ertönt aber eine „Computerstimme“, geht sie als unterstützende Software für uns durch. Dadurch darf sie auch Fehler machen und uns manchmal nicht richtig verstehen. Computer bleibt Computer. - Kontrolle
Kontrolliert die Software uns, oder kontrollieren wir sie? Die Worte „Hey Siri!“ „Alexa…“ oder „Xbox…“ haben den einfachen Nutzen, dem User das Gefühl der Kontrolle über sein Device zu geben. Auch wenn man nie weiß wie viel von den täglichen Gesprächen mitgehört wird, reicht es aus um eine breite Masse in Sicherheit zu wiegen und zum Kauf zu überzeugen. Eine einfache Animation der „eingehenden Sprache“ auf einem Device kann den selben Effekt erzielen. Wenn es aufnimmt, erscheint jene Animation am Screen, ist er schwarz, hab ich meine Ruhe. - Fehler
Gleich wie die Kontrolle über ein Device, zeigen uns seine Fehler, dass wir ihm immer noch übergeordnet sind. „Es kann mich ja garnicht ausspionieren, es versteht ja nicht einmal alle Namen in meinem Adressbuch!“ Auf Grund der künstlichen Stimme und unseren Erfahrungen mit dieser Technologie verzeihen wir derzeit noch vieles. - Bequemlichkeit und Benefits/Nutzen
Was bringt mir dieses Gimmick wirklich? Solange es einen klaren Nutzen erfüllt (z.B. „Xbox, go to settings“) und uns in unserer Bequemlichkeit unterstützt, sehen wir über einiges hinweg. Trotzdem ist es für uns immer angenehmer einfache Befehle zur Steuerung zu verwenden, anstatt dem Device in eigenem Slang nach dem Sinn des Lebens zu fragen.
Zach Holman Blog
Siri in yet another iPhone