Hvordan stemmekryptering er den nye beste funksjonen til Google Dokumenter

Hvordan stemmekryptering er den nye beste funksjonen til Google Dokumenter / Produktivitet

Stemmegjenkjenning pleide å være forferdelig unøyaktig. Det virket bare for en håndfull mennesker en håndfull ganger. Men nå er det faktisk ganske bra, takket være kombinasjonen av Nuance, Microsoft, Apple og Google, som har kastet utallige ressurser til å faktisk forbedre det.

Av alle disse selskapene har få sammenpasset engasjementet for stemmeinnkjenning av Google, som har gjort det til en grunnleggende lynchpin av mobil- og tjenestestrategien.

En av Googles tidligste forsinkelser var den kortvarige GOOG-411 (eller Google Voice Local Search). Den lanserte i 2008 og tillot folk å søke etter telefonnumre til bedriften ved hjelp av stemmen sin. Stemmegjenkjenningsteknologi har også vært et senterdel av Android, og med lanseringen av JellyBean Hva er de største forbedringene i Android 4.2 og 4.3? Hva er de største forbedringene i Android 4.2 og 4.3? Hvis du sitter fast på 4,0 iskremsmelk eller 4,1 gelébønne, skal du oppgradere? Les mer det ble endelig tilgjengelig offline.

Tidligere i uken introduserte Google endelig talegjenkjennelse i Google Dokumenter.

Brukere kan bokstavelig diktere deres dokumenter (mye som jeg gjør med denne artikkelen) uten å måtte installere noen ekstra programvare eller plugin-moduler. Det er et betydelig sprang fremover for den elektroniske kontorpakken, men er det noe bra?

Starter

Før vi begynner å dykke inn i funksjonene, vil jeg berøre hvordan du får Google Voice-skriving. Hvis du har en Google-konto, har du allerede dette. Bare åpne Google Dokumenter, og åpne et nytt eller eksisterende dokument. Deretter vil et vindu dukke opp som vil spørre om du vil prøve taledikusjon. Klikk Prøv det.

Deretter må du gi Google Dokumenter tillatelse til å bruke mikrofonen din. Det handler bare om å klikke Tillate til et popup-vindu.

Deretter må du velge språket du vil bruke med Google Voice-skriving. Spekteret av språk og dialekter som tilbys varierer fra engelsk og spansk til afrikaans og arabisk.

Deretter klikker du bare på mikrofonikonet og begynner å snakke.

Hvor nøyaktig er det?

En av de største hindringene til talegjenkjenning som rammer mainstream, er det ofte det er ikke akkurat nok. Det pleide å være et gitt at hvis du ser bruk stemmeavkjenning, må du tilbringe en god få timers redigering og korrigering av teksten. Så hvordan gir Googles tilbud fare i denne forbindelse?

Ganske gunstig, faktisk. For det meste forstod Google Voice Typing hva jeg sa, selv om jeg har en regional engelsk aksent (vi snakker om aksenter senere).

Jeg var spesielt imponert over måten Googles talegjenkjenning håndterte bakgrunnsstøy. Som jeg skrev denne artikkelen, ble en Yorkshire Terrier skje i stuen min, og vinduet mitt var delvis åpent. Jeg bor på en travel vei hvor biler kjører forbi hele tiden. Men til tross for det, var Google i stand til å filtrere det ut og fokusere på akkurat det jeg sa.

Det største problemet var at Google Voice Typing ofte kjempet med tegnsetting. jeg vil si “komma”, “periode” og “full stopp”, og det ville tolke det som jeg vil skrive “komma”, “periode”, og “full stopp”. Dette var frustrerende av to grunner.

For det første fordi det ville taunt meg, ved å først bruke riktig tegnsetting, før du umiddelbart går tilbake til stavet ut versjonen av ordet. Det var ingen måte å stoppe dette, og jeg måtte manuelt redigere dokumentet for å fikse det.

Men, kanskje verre, jeg kunne ikke hindre det fra å skje. Det er ingen ordbok der du kan overstyre stavemåten. Det skjer bare, og du må takle det.

Jeg vil ikke understreke hvor frustrerende dette er. Det er alvorlig irriterende. Men det er også noe jeg er overbevist om, vil bli forbedret etter hvert som flere og flere bruker denne funksjonen, og som Google forplikter flere ressurser til å forbedre stemmenes anerkjenning.

Foruten den spesielle irritasjonen, var jeg ganske fornøyd med nøyaktigheten av Googles talegjenkjenning.

Hvordan det håndterer aksenter

Jeg ble overrasket over hvor mange språk og dialekter som Google Voice Typing støtter. På engelsk alene støtter den New Zealand, australske, indiske, sørafrikanske, amerikanske og britiske dialekter, for å nevne noen få. Problemet er at det egentlig ikke er en amerikansk aksent, som om det ikke er en britisk aksent. Snarere er det en rekke aksenter og dialekter som avviger fra sted til sted.

Det er en truisme som Storbritannia har en aksent for hver postkode. MakeUseOf-teamet har en rekke forskjellige aksenter blant det britiske personalet. Christian Cawley snakker med en bred Middlesbrough-aksent. Rob Nightingale, som kommer fra Southport, har en mer nordlig drawl. Mens Mark O'Neil har en skotsk twang.

Jeg bor i Liverpool, så jeg har en Scouse aksent som driver litt i Atlanterhavet, i stor grad takket være min amerikanske forlovede og tiden jeg tilbrakte i Sveits.

Og det er rettferdig å si at stemmegjenkjenningsprogrammer ofte sliter med å forstå regionale engelsk dialekter. Når Siri kom ut, for eksempel, var manglende evne til å forstå skotske brukere en løpende spøk.

Men Googles tilbud var eksepsjonell. Tro meg når jeg sier at du ikke trenger å øve med å snakke med en annen aksent Hvilke apper og nettsteder vil bidra til å forbedre mitt aksent når jeg snakker et annet språk? Hvilke apper og nettsteder vil bidra til å forbedre mitt aksent når jeg snakker et annet språk? Jeg vil virkelig gjøre min uttale samsvar med en morsmål. Er det noen apps eller nettsteder som kan hjelpe meg? Les mer . Jeg har snakket med en håndfull venner som også har regionale engelske aksenter, og de har hatt tilsvarende positive erfaringer med det. Mens jeg innrømmer at det er en liten og helt uvitenskapelig prøve, er det absolutt lovende.

Talediktshastighet

Stemmegjenkjenningsprogrammer har tradisjonelt blitt hamstrung av en manglende evne til å holde tritt med den hastigheten som brukeren dikterer. Ganske vist var jeg litt bekymret for at Googles tilbud ikke ville være annerledes, særlig fordi det er en onlinetjeneste, snarere enn et program som kjører på min suppe-opp MacBook Pro.

Men jeg var imponert. Google var i stand til å holde tritt med min høyt koffeinholdige talesats, og fungerte ikke som en flaskehals for produktiviteten min. Det var helt motsatt av mine erfaringer med andre stemme dikteringsverktøy.

Jeg vet ikke om det var fordi jeg har en rask FTTC (Fiber til kabinettet). Hva er forskjellen mellom FTTC og FTTP, og hvorfor bør du bryr deg? Hva er forskjellen mellom FTTC og FTTP, og hvorfor bør du bryr deg? Vi har alle vært der på et eller annet tidspunkt. Syk av vår internettjeneste, på jakt etter en ny måte å koble til Internett, men forvirret av de mange forskjellige alternativene. Les mer hjemme Internett-tilkobling, eller det faktum at Google har en ubegrenset tilgang til raske servere til rådighet. Uansett var jeg i stand til å få ting gjort.

En merknad på mikrofoner

Innebygde mikrofoner pleier å være hit-and-miss. Etter min erfaring er de enten gode, som de er på Apples bærbare datamaskiner, eller de er ikke. Det er svært sjelden noe mellomgrunn.

Generelt, de billigste bærbare PC-ene Best Laptops Under $ 300: Alt du trenger å vite Best bærbare datamaskiner under $ 300: Alt du trenger å vite Å finne en god bærbar PC for mindre enn $ 300 er nesten umulig i disse dager, men kan gjøres hvis du vet hva å se etter. Her er alt du trenger å vite for å kjøpe deg ... Les mer vil ha de verste interne mikrofonene. Det er bare en av de funksjonene som har en tendens til å bli oversett av enhetsprodusenter.

Jeg begynte å diktere denne artikkelen ved hjelp av den interne mikrofonen på MacBook Pro. Selv om Google Docs ofte sa at det hadde problemer med å høre meg, ble det ikke oversatt til langsommere eller unøyaktig diktat. Alt fungerte bra.

Jeg prøvde også Google Voice Typing med en kostbar Blue Yeti ekstern mikrofon. Disse er podcastkvalitetsmikrofoner som selger på Amazon for over $ 100.

Blå Yeti USB Mikrofon - Sølv Blå Yeti USB Mikrofon - Sølv Kjøp nå På Amazon $ 94.49

Admittedly, jeg merket ikke noen forskjeller når det kom til nøyaktigheten eller hastigheten på dikteringen. Men den største fordelen ved å bruke denne mikrofonen var at jeg kunne sette inn et par AKG-hodetelefoner og bruke dem som en skjerm. Dette tillot meg å være mer oppmerksom på bakgrunnsstøy, og å selvjustere om jeg var enten for høy eller for stille.

Siste tanker

Google-stemmegjenkjenning er ikke perfekt. Men det er neppe en overraskelse, så solid stemmeinnkjenning er en ganske vanskelig feat å trekke av. Det er mye jeg følte kunne forbedres.

Dette handler for det meste om hvordan programvaren omhandler tegnsetting og setningsstruktur. I en ideell verden vil Google automatisk sette inn tegnsetting basert på rytmen og kadensen av stemmen din, men vi er en lang veien borte fra det.

Det er også synd at denne programvaren ennå ikke har gjort det til Googles andre tilbud, som Gmail. Ideelt sett vil jeg ha muligheten til å laste ned Google Voice Typing som en app, og bruke den med andre programvaren, som iWorks sider Pages 5.0 for Mac inkluderer Smart Inspector Panel, men færre funksjoner Sider 5.0 for Mac inkluderer Smart Inspector Panel, Men færre funksjoner Det er mange lettvektige og brukervennlige tekstredigerere for Mac-brukere, men for prosjekter som krever desktop publishing-funksjoner, er Apples nylig gjennomsøkte sider fortsatt en god løsning. Les mer eller markdown editoren IA Writer iA Writer for Mac og iOS: Den beste tekstbehandleren du aldri har brukt iA Writer for Mac og iOS: Den beste tekstbehandleren du aldri har brukt Er det et skolepapir eller et blogginnlegg, vi alle på et tidspunkt befinner oss i stand til å dumpe en haug med tegn inn i en tekstfil. Mens mobiltelefonen ... Les mer .

Men det er to mindre irritasjoner, Google Voice Typing er så god som det blir. Til kontrast skrev jeg denne delen av artikkelen ved hjelp av den innebygde stemmegjenkjenningen til OS X, og det var ikke så nær så nøyaktig, og heller ikke så fort.

Hvis dette ikke overtaler folk til å bytte til Google Disk, vet jeg ikke hva som vil.

Nå over til deg! Har du blitt fristet av Google Disks talegjenkjenning? Har du prøvd det, ennå? Fortell meg alt om det i kommentarene nedenfor.

Les mer om: Google Dokumenter, Talegjenkjenning, Tale til tekst.