Glem Siri 4 måter Telefonen din handler om å bli smartere
Alle tre av de store telefonplattformene har nå sin egen stemme. Apple har Siri, Microsoft har Cortana, og Google har den noe mindre sassy Google Nå 6 Google Nå-funksjoner som vil endre hvordan du søker 6 Google Nå-funksjoner som vil endre hvordan du søker Du kan allerede bruke Google Nå på Android-enheten din, men får du alt du kan ut av det? Å vite om disse små funksjonene kan gjøre en stor forskjell. Les mer .
Disse systemene lar deg håndtere grunnleggende oppgaver gjennom talestyring. Hver er en slags virtuell sekretær som kan svare på enkle spørsmål, åpne apper, lage notater og relémeldinger. De er nyttige, men de er også frustrerende begrenset. De kan ikke gjøre noe de ikke var eksplisitt programmert for, og mange oppgaver er ganske enkelt utenfor deres evner.
Imidlertid er det en rekke teknologier som utvikles som skal forbedre disse systemene dramatisk - og de kommer til å være kommersielt tilgjengelige om få år. Her er de fem beste måtene telefonen din er i ferd med å bli mye smartere.
Det vil se hva du ser
Taleegenkjenning har gjort store fremskritt de siste fem årene, takket være utviklingen av kraftige nevrale nettverk. Moderne smarttelefoner kan identifisere tale med overraskende nøyaktighet (det har vært en stund siden Google Now har misforstått meg), og kan til og med gjøre ting som å identifisere sanger og tv-programmer basert på lyden deres.
Dette er flott - men det er bare starten. Mennesker samhandler ikke med verden først og fremst gjennom lyd. Vi bruker visjon for praktisk talt alt - og snart vil våre maskiner også. Vi begynner å se debuten til de første bærbare headsettdisplayene som Google Glass og Microsofts HoloLens Microsoft Shows Off New HoloLens Demoer på Build Conference Microsoft viser av New HoloLens Demos på Build Conference Microsofts kommende HoloLens-headset er den første high-end utvidede virkeligheten enhet som har blitt vist for publikum. Er det fortsatt en fantasifull gizmo eller en teknologi som er nær realisering? Les mer, som kan streame informasjon fra sine kameraer til smarttelefonen, og gir en rik og kontinuerlig tilgang til visuell informasjon. Mange observatører, inkludert meg selv, forventer at disse blir vanlige i løpet av de neste fem årene eller så.
Så hva kan telefonen gjøre med alle disse dataene?
Plenty. Google har allerede demonstrert med sin Tango-tavle Google ønsker å sette et 3D-kamera på smarttelefonen - Her er hvorfor Google vil sette et 3D-kamera på smarttelefonen - Her er hvorfor Googles Project Tango bringer 3d sensorer til mobile enheter. Her er det vi vet så langt. Les mer at et dybdekamera kan bestemme fysisk plassering av fysiske gjenstander med ekstremt høy nøyaktighet. På samme måte har det vært noen fantastiske fremskritt innen maskinvisjon - som Microsofts nevrale nettverk som kan identifisere enkelte hunderaser, og Googles nevrale nettverk som nøyaktig kan beskrive innholdet i fotografier. Sammen åpner disse teknologiene en hel verden av applikasjoner:
Hva er denne bolten? Maskinens visjonsalgoritme vet, og kan bestille en erstatning på Amazon om fem sekunder. Hva var navnet på kvinnen du møtte i baren i går kveld? Du har kanskje mistet kortet hennes, men brillene dine tok ansiktet hennes, og kan finne henne på Facebook. Du har en merkelig mol. Skal du se legen din? Telefonen kan ta en titt og gi deg beskjed. Du er dagligvarebutikk: hva trenger du? Brillene dine husker sist du så i kjøleskapet ditt, og vet hva som mangler. De kan til og med gi deg veibeskrivelser for å finne de enkelte elementene.
Personvernimplikasjonene av denne teknologien er skremmende, men denne typen ting lyder også utrolig nyttig.
Det vil vite hva du liker
Smak kan være en vanskelig ting å klemme ned. Det er veldig personlig, og kan være veldig vilkårlig. Spotify og Netflix fortsetter å gjøre anbefalinger basert på bruksmønstre (en teknikk som helt ignorerer innhold) - men det er reelle grenser for denne tilnærmingen.
Fremtiden er i algoritmer som kan forstå kunst på et dypt nivå - komplekse nevrale nettverk som kan lære å velge komplekse subtiliteter av musikk og filmer. Det gir en mye rikere forståelse av hva folk gjør og ikke liker om et stykke media - en konkret forståelse av deres smak.
De første tidlige hintene av dette begynner å dukke opp. Som Spotify er “Oppdag Ukentlig” spilleliste, som bruker disse typer innholdsanalyseringsverktøy til å anbefale sanger - inkludert sanger som du kanskje ikke vanligvis hører, fordi de er for obskure for å rangere godt basert på bruksmønstre. Disse teknikkene kommer bare til å bli kraftigere i fremtiden, og smarttelefonen er en god plattform for å utnytte denne informasjonen.
Leter du etter noe å gjøre med venner? Hva skjer hvis apper på telefonene dine kan samarbeide, lagre informasjon om dine respektive smaker, og velg en film eller konsert som de tror du vil like? Hva med datingsider som rangerer deg basert på dype egenskaper av din smak? Hva med programmer som kan anbefale deg bøker, fordi de har lest dem?
Mulighetene er uendelige, og noen kommer til å tjene mye penger med disse.
Det blir Chatty
Menneskelig: hvor er du nå?
Maskin: Jeg er midt i ingensteds.
Menneskelig: hva er meningen med å dø?
Maskin: å ha et liv.
Menneskelig: hva er meningen med å være intelligent?
Maskin: å finne ut hva det er.
Menneskelig: Hva er formålet med følelser?
Maskin: Jeg vet ikke.
Dette er en samtale med et neuralt nettverk utviklet av Google, som lærer fra store databaser med tekst uten menneskelig tilsyn. Denne versjonen av den ble trent på en rekke gamle filmskript, og trent til å forutsi neste setning i hver samtale det oppsto. Som det viser seg, hvis du trener en AI på filmskript, er alle samtalene hans super dramatisk.
Hvis du ikke er imponert, er det forståelig. Chatbots har eksistert i lang tid Hvordan lage en chat-bot for nettstedet ditt eller firmaet Hvordan lage en chat-bot for nettstedet ditt eller virksomheten Sværheten med å koble med så mange mennesker over hele verden er tidssoner. Du vil kanskje være tilgjengelig for å samhandle med leseren eller å gjøre forretninger med potensielle kunder, men på noen ... Les mer .
Men ta en nærmere titt. Googles system er spesielt på to viktige måter.
For det første er det veldig enkelt når det gjelder arkitektur: det er et enkelt stort nevralt nettverk, og det måtte selv lære seg dynamikken i det menneskelige språket. Vanlige chatbots fungerer ved å bruke tusenvis av håndkodede regler for hvordan du svarer på ulike situasjoner. Når de resiterer et svar, er det fordi det var håndkodet, eller memorert fra et bestemt eksempel. Googles nettverk er annerledes. Den lærte sin oppførsel organisk, ved å prøve å forstå den dype strukturen av menneskelig skriving.
For det andre fanger det noen overraskende subtile dynamikker som andre chatbots ikke gjør. Det kan svare på sunn fornuftspørsmål om verden, til tross for ikke å være eksplisitt programmert til å gjøre det.
Menneskelig: hvem er skywalker ?
Maskin: han er en helt .
Menneskelig: hvem er regningen clinton ?
Maskin: han er en milliardær .
Menneskelig: er himmelsblå eller svart ?
Maskin: blå .
Menneskelig: har en katt en hale ?
Maskin: ja .
Menneskelig: har en katt en vinge ?
Maskin: Nei
Menneskelig: kan en katt fly ?
Maskin: Nei .
Menneskelig: hvor mange ben har en katt ?
Maskin: fire tror jeg .
En annen versjon av chat-botten, som er utdannet på teknisk supportlogger, kan forvirre gjennom å gi ekte teknisk støtte overraskende bra. Det er stumbles (det synes å ha problemer med å huske hvilket operativsystem du bruker) - men jeg har sikkert fått verre teknisk støtte fra de faktiske menneskene.
Alt dette er en god indikasjon på at vi begynner å komme til det punktet hvor kunstig intelligens kan være virkelig konversasjon. Nettverket ovenfor kan utføre en tålelig samtale, selv om treningsmålene bare krever at den følger den overfladiske strukturen i en frem og tilbake dialog.
Gitt bedre treningsdata og en belønningsfunksjon som legger vekt på informasjonsutveksling, er mulighetene ubegrensede. Tenk deg en versjon av Siri som kan engasjere deg i en ekte samtale, gi svar og råd som svar på spørsmål, og utføre oppgaver uten å være spesielt programmert for å gjøre det. Det er ikke langt unna.
Det blir godt lest
En annen teknologi som Google har jobbet med, har å gjøre med leseforståelse. Det heter “Tanke vektorer,” og konseptet er overraskende enkelt. Du kan trekke ut “tankevektorer” fra aktiviteten til et neuralt nettverk som har et stykke informasjon, som en setning eller en artikkel. Det du får er en ugjennomsiktig informasjon som betyr ingenting for alle, unntatt nettverket som genererte det. Denne informasjonen, i noen grad, lagrer “betydning” av teksten, adskilt fra hvordan den ble opprinnelig formulert.
Dette har noen nyttige egenskaper. For det første ligner disse vektorene hverandre for setninger med lignende betydninger. Hvis du fordøyer to setninger på denne måten, kan du avgjøre om de betyr det samme eller ikke. Du kan også manipulere dem. Ved å bruke to nevrale nettverk for å generere “tankevektorer” fra tekst på forskjellige språk og deretter trene et tredje nettverk for å lære å kartlegge mellom dem, kan du opprette en ekstremt kraftig maskinoversettelsesmetode som fanger inn betydningen av teksten, og ikke bare ordene i den.
En annen potensiell anvendelse av dette er å bruke denne teknologien til å samle store mengder informasjon og fordøye den til en kompakt representasjon, og deretter generere et sammendrag basert på utdataene. Dette kan være enormt kraftig for mobile applikasjoner.
Tenk deg å kunne spørre telefonen din om å lese alt som er tilgjengelig på Google om et gitt emne. Så kom tilbake til deg og rapportere dens funn kortfattet, i naturlig språk, og svar på spørsmål om resultatene. Dette kommer til å bli realitet virkelig, virkelig snart, og det kommer til å være utrolig nyttig.
Fremtidens telefon
Telefoner i fremtiden vil nok se veldig annerledes ut enn telefoner i dag. De kan være buede. De kan være modulære. Du kan interagere med dem ved hjelp av forstørrede virkelighetsbriller. Imidlertid vil den viktigste forskjellen være intelligens. Funksjonene som beskrives her, vil forvandle enhetene til kraftige veiledere og hjelpere.
Det er for tiden et oppvarmet våpenløp Microsoft vs Google - Hvem leder det kunstige intelligensløpet? Microsoft vs Google - Hvem leder det kunstige intelligensløpet? Kunstig intelligensforskere gjør konkrete fremskritt, og folk begynner å snakke seriøst om AI igjen. De to titanene som leder kunstig intelligensløp er Google og Microsoft. Les mer i dyp læringsteknologi. Bivirkningen er at disse teknikkene utvikler seg utrolig raskt, og de kommer på markedet raskere enn du kanskje tror.
Er du spent på smartere smarttelefoner? Bekymret for personvernimplikasjonene? Gi oss beskjed i kommentarene!
Image Credits: Menneskelig hjerne av Mopic via Shutterstock
Utforsk mer om: Kunstig intelligens, mobilautomatisering, Siri, talegjenkjenning, slitesterk teknologi.