Wie Voice-Typisierung die neue beste Funktion von Google Docs ist

Die Spracherkennung hat sich in den letzten Jahren sprunghaft verbessert. Anfang der Woche hat Google die Spracheingabe in Google Text & Tabellen eingeführt. Aber ist es gut? Lass es uns herausfinden!

Die Spracherkennung hat sich in den letzten Jahren sprunghaft verbessert.  Anfang der Woche hat Google die Spracheingabe in Google Text & Tabellen eingeführt.  Aber ist es gut?  Lass es uns herausfinden!
Werbung

Spracherkennung war früher furchtbar ungenau. Es funktionierte nur für eine Handvoll Leute eine Handvoll der Zeiten. Aber jetzt ist es eigentlich ziemlich gut, dank der gemeinsamen Anstrengungen von Nuance, Microsoft, Apple und Google, die unzählige Ressourcen geworfen haben, um es tatsächlich zu verbessern.

Von all diesen Unternehmen haben nur wenige das Engagement für die Spracherkennung von Google erreicht, das es zu einem grundlegenden Dreh- und Angelpunkt seiner Mobil- und Servicestrategie gemacht hat.

Einer der frühesten Vorstöße von Google war der kurzlebige GOOG-411 (oder Google Voice Local Search). Es wurde 2008 eingeführt und ermöglichte es Personen, mithilfe ihrer Stimme nach geschäftlichen Telefonnummern zu suchen. Spracherkennungstechnologie war auch ein zentraler Bestandteil von Android, und mit der Einführung von JellyBean Was sind die größten Verbesserungen in Android 4.2 und 4.3? Was sind die größten Verbesserungen in Android 4.2 und 4.3? Wenn Sie auf 4.0 Ice Cream Sandwich oder 4.1 Jelly Bean stecken, sollten Sie upgraden? Read More es wurde endlich offline verfügbar.

Anfang der Woche hat Google endlich die Spracherkennung in Google Text & Tabellen eingeführt.

Benutzer können ihre Dokumente buchstäblich diktieren (ähnlich wie bei diesem Artikel), ohne dass zusätzliche Software oder Plug-Ins installiert werden müssen. Es ist ein bedeutender Fortschritt für die Online-Office-Suite, aber ist es gut?

Anfangen

Bevor wir mit den Funktionen beginnen, möchte ich kurz erläutern, wie Sie Google Voice Typing erhalten. Wenn Sie ein Google-Konto haben, haben Sie dies bereits. Öffnen Sie einfach Google Text & Tabellen und öffnen Sie ein neues oder vorhandenes Dokument. Dann erscheint ein Fenster, in dem Sie gefragt werden, ob Sie das Sprachdiktieren ausprobieren möchten. Klicken Sie auf Versuch .

GoogleVoiceTypingTry

Als Nächstes müssen Sie Google Docs die Erlaubnis erteilen, Ihr Mikrofon zu verwenden. Das ist nur eine Frage des Klickens auf Ein Popup-Fenster erlauben .

MikrofonPermission

Dann müssen Sie die Sprache auswählen, die Sie mit Google Voice Typing verwenden möchten. Das Angebot an Sprachen und Dialekten reicht von Englisch und Spanisch über Afrikaans bis hin zu Arabisch.

Screen Shot 2016-02-25 am 10.14.12

Klicken Sie dann auf das Mikrofonsymbol und beginnen Sie zu sprechen.

Wie genau ist es?

Eine der größten Hürden für die Spracherkennung, die den Mainstream trifft, ist, dass es oft nicht genau genug ist . Früher war es üblich, dass Sie, wenn Sie Spracherkennung verwenden, einige Stunden damit verbringen müssen, Ihren Text zu bearbeiten und zu korrigieren. Wie geht das Google-Angebot in dieser Hinsicht voran?

Ziemlich günstig eigentlich . In den meisten Fällen hat Google Voice Typing verstanden, was ich gesagt habe, obwohl ich einen regionalen englischen Akzent habe ( wir werden später über Akzente sprechen ).

GoogleVoiceOn

Ich war besonders beeindruckt von der Art und Weise, in der Googles Spracherkennung Hintergrundgeräusche behandelte. Als ich diesen Artikel schrieb, bellte ein Yorkshire Terrier in meinem Wohnzimmer, und mein Fenster war teilweise offen. Ich lebe auf einer belebten Straße, auf der ständig Autos vorbeifahren. Aber trotzdem konnte Google das herausfiltern und sich genau auf das konzentrieren, was ich gesagt habe.

Das größte Problem war Google Voice Typing oft mit Interpunktion gekämpft. Ich würde sagen "Komma", "Punkt" und "Punkt", und es würde das so interpretieren, als ob ich "Komma", "Punkt" und "Punkt" schreiben wollte. Dies war aus zwei Gründen frustrierend.

Punkt

Erstens, weil es mich verspotten würde, indem ich zuerst die richtige Interpunktion verwende, bevor ich sofort auf die buchstabierte Version des Wortes zurücksetze. Es gab keine Möglichkeit, dies zu stoppen, und ich müsste das Dokument manuell bearbeiten, um es zu beheben.

Aber, vielleicht noch schlimmer, ich konnte es nicht verhindern. Es gibt kein Wörterbuch, in dem Sie Schreibweisen überschreiben könnten. Es passiert einfach und du musst damit umgehen.

Ich möchte nicht untertreiben, wie frustrierend das ist. Es ist sehr nervig . Aber ich bin zuversichtlich, dass dies auch verbessert wird, da immer mehr Nutzer diese Funktion nutzen und Google mehr Ressourcen zur Verbesserung der Spracherkennung zur Verfügung stellt.

Abgesehen von diesem besonderen Ärgernis war ich sehr zufrieden mit der Genauigkeit der Spracherkennung von Google.

Wie es Akzente behandelt

Ich war erstaunt, wie viele Sprachen und Dialekte Google Voice Typing unterstützt. In Englisch allein unterstützt es die neuseeländischen, australischen, indischen, südafrikanischen, amerikanischen und britischen Dialekte, um nur einige zu nennen. Das Problem ist, dass es nicht wirklich einen amerikanischen Akzent gibt, ähnlich wie es keinen britischen Akzent gibt. Vielmehr gibt es eine Reihe von Akzenten und Dialekten, die sich von Ort zu Ort unterscheiden.

Es ist eine Binsenwahrheit, dass das Vereinigte Königreich einen Akzent für jede Postleitzahl hat. Das MakeUseOf-Team hat eine Reihe unterschiedlicher Akzente unter den britischen Mitarbeitern. Christian Cawley spricht mit einem breiten Middlesbrough-Akzent. Rob Nightingale, der aus Southport stammt, hat eine eher nördliche Stimme. Während Mark O'Neil einen schottischen Twang hat.

Ich lebe in Liverpool, deshalb habe ich einen Scous-Akzent, der leicht in den Atlantik driftet, hauptsächlich dank meiner amerikanischen Verlobten und der Zeit, die ich in der Schweiz verbrachte.

Und es ist fair zu sagen, dass Spracherkennungsprogramme oft Schwierigkeiten haben, regionale englische Dialekte zu verstehen. Als Siri zum Beispiel herauskam, wurde seine Unfähigkeit, schottische Nutzer zu verstehen, zum Witz.

Aber das Angebot von Google war außergewöhnlich. Glauben Sie mir, wenn ich sage, dass Sie nicht üben müssen, mit einem anderen Akzent zu sprechen Welche Apps & Webseiten helfen, meinen Akzent zu verbessern, wenn Sie eine andere Sprache sprechen? Welche Apps und Websites helfen, meinen Akzent beim Sprechen einer anderen Sprache zu verbessern? Ich möchte wirklich, dass meine Aussprache der eines Muttersprachlers entspricht. Gibt es Apps oder Websites, die mir helfen können? Weiterlesen . Ich habe mit einer Handvoll Freunde gesprochen, die auch regionale englische Akzente haben, und sie haben ähnlich positive Erfahrungen damit gemacht. Ich gebe zu, dass dies eine kleine und völlig unwissenschaftliche Probe ist, aber es ist sicherlich vielversprechend.

Sprachdiktiergeschwindigkeit

Spracherkennungsprogramme wurden traditionell durch die Unfähigkeit behindert, mit der Geschwindigkeit Schritt zu halten, zu der der Benutzer diktiert. Zugegebenermaßen war ich ein wenig besorgt, dass das Angebot von Google nicht anders wäre, zumal es sich um einen Online-Dienst handelt und nicht um ein Programm, das auf meinem aufgemotzten MacBook Pro läuft.

Aber ich war beeindruckt. Google war in der Lage, mit meiner hochkoffeinierten Sprechgeschwindigkeit Schritt zu halten und wirkte nicht als Engpass für meine Produktivität. Es war das komplette Gegenteil meiner Erfahrungen mit anderen Sprachdiktatwerkzeugen.

VoiceRecognitionSpeed

Ich weiß nicht, ob das so war, weil ich einen schnellen FTTC (Fibre to the Cabinet) habe. Was ist der Unterschied zwischen FTTC und FTTP, und warum sollten Sie sich darum kümmern? Was ist der Unterschied zwischen FTTC und FTTP, und warum sollten Sie sich interessieren? Wir waren alle irgendwann dort. Krank von unserem Internet-Service, auf der Suche nach einem neuen Weg, um mit dem Internet verbinden, aber durch die vielen verschiedenen Möglichkeiten verwirrt. Lesen Sie mehr zu Hause Internet-Verbindung, oder die Tatsache, dass Google eine unbegrenzte Versorgung mit schnellen Servern zur Verfügung hat. Wie auch immer, ich konnte Dinge erledigen.

Eine Anmerkung zu Mikrofonen

Eingebaute Mikrofone neigen dazu, ein Hit-and-Miss zu sein. Meiner Erfahrung nach sind sie entweder exzellent, so wie sie auf Apple-Laptops sind oder nicht. Es gibt sehr selten einen Mittelweg.

Als eine allgemeine Regel, die billigsten Laptops Beste Laptops unter $ 300: Alles, was Sie wissen müssen Beste Laptops unter $ 300: Alles, was Sie wissen müssen Suche nach einem guten Laptop für weniger als $ 300 ist fast unmöglich in diesen Tagen, aber kann getan werden, wenn Sie was wissen zu suchen. Hier finden Sie alles, was Sie wissen müssen, um einen Kauf zu tätigen ... Read More wird die schlechtesten internen Mikrofone haben. Es ist nur eine dieser Funktionen, die von Geräteherstellern oft übersehen werden.

Ich habe begonnen, diesen Artikel mit dem internen Mikrofon meines MacBook Pro zu diktieren. Obwohl Google Docs häufig sagte, es habe Schwierigkeiten, mich zu hören, hat dies nicht zu langsameren oder ungenauen Diktaten geführt. Alles hat gut funktioniert.

Ich habe auch Google Voice Typing mit einem teuren Blue Yeti External Microphone ausprobiert. Dies sind Mikrofone in Podcast-Qualität, die bei Amazon für über $ 100 verkauft werden.

Blue Yeti USB Mikrofon - Silber Blau Yeti USB Mikrofon - Silber Jetzt kaufen bei Amazon 110, 00 €

Zugegeben, ich habe bei der Genauigkeit oder der Geschwindigkeit des Diktats keine Unterschiede festgestellt. Der größte Vorteil dieses Mikrofons war jedoch, dass ich ein paar AKG-Kopfhörer einsetzen konnte und sie als Monitor nutzte. Dadurch konnte ich mehr Hintergrundgeräusche wahrnehmen und mich selbst einstellen, wenn ich entweder zu laut oder zu leise war.

Abschließende Gedanken

Die Google-Spracherkennung ist nicht perfekt. Aber das ist keine Überraschung, denn solide Spracherkennung ist eine ziemlich harte Leistung. Es gibt eine Menge, die ich verbessern könnte.

Dabei geht es hauptsächlich darum, wie die Software mit Interpunktion und Satzstruktur umgeht. In einer idealen Welt würde Google automatisch Interpunktion basierend auf dem Rhythmus und der Kadenz Ihrer Stimme einfügen, aber wir sind weit davon entfernt.

Es ist auch schade, dass diese Software noch nicht in anderen Google-Angeboten wie Gmail Einzug gehalten hat. Idealerweise hätte ich gerne die Möglichkeit, Google Voice Typing als App herunterzuladen und mit anderen Softwareprogrammen wie iWork Pages Pages 5.0 für Mac zu verwenden, einschließlich Smart Inspector Panel, aber weniger Features Pages 5.0 für Mac mit Smart Inspector Panel. Aber weniger Funktionen Es gibt viele leichte und einfach zu bedienende Texteditoren für Mac-Benutzer, aber für Projekte, die Desktop-Publishing-Funktionen erfordern, ist Apples kürzlich überarbeitete Seiten immer noch eine gute Lösung. Lesen Sie mehr oder den Markdown-Editor IA Writer iA Writer für Mac & iOS: Das beste Textverarbeitungsprogramm, das Sie noch nie benutzt haben iA Writer für Mac & iOS: Das beste Textverarbeitungsprogramm, das Sie noch nie benutzt haben Sei es eine Schulzeitung oder ein Blogbeitrag, Wir alle sind irgendwann in der Lage, eine Menge Zeichen in eine Textdatei zu schreiben. Während Handy ... Lesen Sie mehr.

Aber das sind zwei kleine Ärgernisse, Google Voice Typing ist so gut wie es geht. Im Gegensatz dazu habe ich diesen Abschnitt des Artikels mit der integrierten Spracherkennung von OS X geschrieben, und er war bei weitem nicht so genau und nicht so schnell.

Wenn dies die Leute nicht dazu bewegt, zu Google Drive zu wechseln, weiß ich nicht, was.

Jetzt rüber zu dir! Haben Sie sich von der Google Drive-Spracherkennung verlocken lassen? Hast du es schon ausprobiert? Erzähl mir alles in den Kommentaren unten.

In this article