Kan programmer som Wiki Bot noensinne produsere alt Internett-innhold?
Tenk deg å fullføre en roman, og innse at det er en av de beste romanen du noensinne har lest. Deretter forteller noen at romanen er skrevet av en robot. Ville du tro på dem?
I dag er lingvistikkens verden og kunstig intelligens i den tidligste, banebrytende utviklingsfasen av “bot” forfattere. I dag bruker minst to av de mest betydningsfulle innholdsproduktørene på Internett - Wikipedia og Associated Press - begge roboter til å skrive elektroniske artikler.
Ved første rødme virker dette som en sjokkerende evolusjon av kunstens kunst. De fleste tror at det er visse menneskelige oppgaver eller jobber. Tekniske jobber i fremtiden: Hva skal du studere hvis du vil ha en kul jobb i morgen Tekniske jobber i fremtiden: Hva skal du studere hvis du vil ha en kul jobb i morgen Hvis du er student og ser etter å lande en god teknologisk jobb i fremtiden, forståelse av retningen av teknologi vil hjelpe deg med å posisjonere deg selv for å lykkes, og finne ut hva du skal studere for å få ... Les mer som aldri kan erstattes av roboter 6 Menneskelige jobber som datamaskiner vil aldri erstatte 6 Menneskelige jobber som datamaskiner aldri vil erstatte Les mer - og en aktivitet som er så kreativ og kompleks som å skrive er en av disse. Eller er det?
Wiki Bot
Den virtuelle drømmen som nylig mottok den største pressen, er en Wikipedia-bot som heter Lsjbot. Det er opprettelsen av Sverker Johansson i Sverige, som skrev koden for å skrape informasjon fra en rekke klarerte kilder, med det formål å kutte sammen korte artikler kalt “stubber” om emner relatert til dyre taksonomi.
Lsjbot pumper angivelig ut 10.000 artikler per dag og har hittil skrevet over 2,7 millioner artikler, alle av dem lesbare og forståelige. Medierapporter som det på Popular Science sier at dette representerer “8,5 prosent av artiklene på Wikipedia”. Imidlertid, som Wikimedia-bloggen forklarer, utgjør de svenskspråklige artiklene en svært stor del av artiklene på svensk Wikipedia, men ingen av dem utgjør det mye mer populære og voluminøse engelskspråklige Wikipedia.
Med det sagt, betyr det ikke engelsk Wikipedia er fri for bot invasjonen. Den virkelige invasjonen startet vei tilbake i 2002, da Wikipedia-kurator “Ram-Man” skapte en kunstig intelligens 7 fantastiske nettsteder for å se de nyeste i kunstig intelligensprogrammering 7 fantastiske nettsteder for å se de siste i kunstig intelligensprogrammering Kunstig intelligens er ennå ikke helt fra 2001: Space Odyssey ... men vi blir veldig nært. Sikkert nok, en dag kan det være som ligner på sci-fi-pottekokerene som blir klemt av Hollywood ... Les mer programmet han ringte “rambot”, som egentlig var et skript som ville skrape tabeller fra US-folketellingen, og trykke tusenvis av artikler om dagen som dekker omtrent enhver liten by, by eller fylke i hele USA, og selv i noen kommuner i andre land.
Omtrent alt område du søker etter på Wikipedia, har sannsynligvis sin første utkast til Wiki-artikkel opprettet av Rambot. Selv den lille lille 800 personbyen der jeg vokste opp, har sin egen Wikipedia-side, opprettet i 2002!
Andre Wikipedia-artikkel-produserende bots gjennom årene inkluderte:
- Robbot - En bot som i utgangspunktet ble brukt til å løse interlanguage-koblinger, og til slutt å løse disambiguering-sidelinker.
- Asteroids - Denne boten skrapte NASA data og skrev tusenvis av Wiki artikler om asteroider.
I dag er det bare under tusen Wiki-bots som støtter Wikipedia, og gjør stadig til eksisterende sider når feil eller utelatelser blir funnet. Den mest aktive er Cydebot, som hittil har laget over 4,5 millioner redigeringer på Wikipedia-sider.
Annet Bot-laget innhold
I juli i år annonserte Associated Press at den ville produsere automatiserte, robotskrevne forretningsartikler. Forbes bruker angivelig roboter til å legge inn korte aksjebaserte artikler om selskaper som har det bra i markedet.
Den mest imponerende bruken av bot-teknologi for artikkelskaping var journalist / programmør Ken Schwenche fra Los Angeles Times, som skrev et program kalt Quakebot for automatisk å skrive artikler om jordskjelv bare øyeblikk etter at de oppsto. Dataene for artiklene kommer direkte ut av US Geological Survey-varslene. I et skiferintervju rapporterte Ken at bare i år, takket være Quakebot, ble LAT det første mediautløpet for å rapportere om en morgenskjelv innen tre minutter etter at hendelsen faktisk fant sted.
Stillingen besto av bare fire korte avsnitt, og ble fremstilt ved å interlacing de relevante dataene med en forhåndskrevet mal som Schwencke hadde opprettet før tiden.
Akkurat som Forbes-lagerrapporter og AP-forretningsartikler er rapportene raske, effektive og få jobben gjort, men representerer de en fremtid. Her er hvorfor forskere tror du burde være bekymret for kunstig intelligens. Her er hvorfor forskere tror at du burde være bekymret for Kunstig intelligens Synes du at kunstig intelligens er farlig? Kan AI utgjøre en alvorlig risiko for menneskeheten. Dette er noen grunner til at du kanskje vil være bekymret. Les mer hvor mer komplekse og kreative artikler kan bli skrevet av bots? Skal menneskelige forfattere være bekymret?
Skrive om komplekse historier
Selvfølgelig har lingvistikken vært en del av Artificial Intelligence i svært lang tid. I artikkelen “Kunstig intelligens”, publisert i Håndbok av Pragmatikk, forfatterne skrev:
Å generere et utvidet diskurs involverer noe forsiktig planlegging. Denne komplekse oppgaven har beleilig blitt delt inn i to deltakere: bestemme hva du skal si og bestemme hvordan du skal si.
Med andre ord, AI-forskere, i å forsøke å få en maskin til å skape diskurs som virker autentisk for mennesker, trenger ikke bare å sammenføye de riktige ordene å si, men “bot” må også forstå hvordan man sier de tingene i sammenheng med emnet. Dette er vanskelig nok for det menneskelige sinn, hvor verdsettelse for konteksten er innebygd i barn fra en svært ung alder. For maskiner er det et helt annet ballspill.
Generering av diskurs er en multipelt begrenset prosess der ulike kunnskapskilder bør tas i betraktning: kunnskap om diskursdomenet, situasjonskonteksten og tidligere diskurs, samt kunnskap om samtalepartneren eller leseren.
Forstå innholdet, ha en kunnskapsbase av eksisterende informasjon og data der ute, og viktigst av alt å forstå hva leseren ønsker, er alle kritiske stykker av å kutte sammen, ikke bare informativ tekst, men også for å skape mer abstrakt skriving som kreativ fiksjon.
Forfattere - selv veldig unge forfattere - lærer å gjøre dette på et intuitivt nivå. For programmerere å skape kunstig intelligens som kan gjøre det samme, krever det et nivå av algoritmegenerering (og selvundervisning) som fortsatt er langt mer avansert enn hva data-skrapende bots av Wiki, Associated Press og andre ennå er i stand til . Likevel beskrev disse forfatterne hvordan det ikke er umulig.
For det første kan nye symboler og strukturer opprettes dynamisk under programgjennomføring. For det andre kan strukturer rekursivt defineres og kan dermed representere et potensielt uendelig antall faktiske strukturer. Og tredje er programmer også symbolske strukturer og kan dermed opprettes eller manipuleres av andre programmer.
Hvis du ser på forsøket av Ken Schwenche om å bruke Quakebot til å generere raske, nøyaktige artikler om jordskjelv, ser du at noen folk spiller enkle spill ved å formulere maler som programmet kan bruke til å bare sette inn dataene der det må gå , og artikkelen “lyder” som om det var menneskelig generert - men bare fordi det faktisk var menneskelig generert på forhånd.
Det er imidlertid noen som, for eksempel firmaet Narrative Science, som tar dette konseptet på et helt nytt nivå og faktisk bruker en grov form for AI Thinking Machines: Hva Neuroscience og Artificial Intelligence kan lære oss om bevissthet Tenkemaskiner: Hva Neuroscience og Kunstig intelligens kan lære oss om bevissthet Kan bygningen kunstig intelligente maskiner og programvare lære oss om bevissthetens arbeid og naturen til det menneskelige sinn selv? Les mer til innholdet som de produserer for selskaper som Forbes og den offentlige etterretningsleverandøren In-Q-Tel.
Programmer som skriver som mennesker
Det som programmørene på Narrative Science gjør er å ta komplekse data - enten det er scoringmønster og spillerstatistikk i løpet av et profesjonelt fotballkamp, eller aksjeværdiene og bedriftsdataene om selskaper - og å bruke dataene selv for å formulere nøyaktig hva som trenger å bli sagt og hvordan å si det.
Så for eksempel i 2011 ga The New York Times en utdrag av en sportsrapport fra Narrative Science, som viser akkurat hva denne teknologien er i stand til.
WISCONSIN ser ut til å være i førersetet på vei til en seier, da det fører 51-10 etter tredje kvartal. Wisconsin la til ledelsen da Russell Wilson fant Jacob Pedersen for en åtte-yard touchdown for å få scoret 44-3 .
Som du kan se, skaper Narrative Science en algoritme som bruker både konteksten (sport) og dataene (score og spillerstatistikk), for å formulere en rapport som høres nøyaktig ut som hva sportsfansmenn forventer å lese fra en menneskelig skriving om sport.
Hvor Bots går fra her
Selv denne imponerende bruken av dataanalyse og AI-lingvistikk er svært begrenset i omfang og evne. Selskapets grunnlegger Kris Hammond gjorde en over-the-top påstand om at i 20 år kan selskapets eget dataprogram kunne vinne en Pulitzer-pris i journalistikk.
Mens entusiasmen er lovverdig, er virkeligheten at det nok vil ta godt over tjue år for å oppnå den prestasjonen.
Tilfelle i punkt: Bare i år opprettet forskere ved University of New South Wales i Australia et dataprogram som de ringte til “Moral Storytelling System”. Målet var at systemet skulle skape en fabel basert på brukerpreferanser.
Moral Storytelling System skapte en fabel som var ment å skildre leksjonen til gjengjeldelse, hvor en eventyr straffes for å stjele en ridder sverd. Dette er historien som dataprogrammet kom opp med.
En gang bodde det en enhjørning, en ridder og en eventyr. Enhjørningen elsket ridderen.
En sommermorgen stjal feen sverd fra ridderen. Som et resultat hadde ikke ridderen sverd lenger. Ridderen følte seg nødt til at han ikke hadde sverd lenger. Ridderen følte sinne mot feen om å stjele sverdet fordi han ikke hadde sverd lenger. Enhjørningen og ridderen begynte å hate eventyret.
Neste dag kidnappet enhjørningen eventyret. Som et resultat var feen ikke ledig. Eventyret følte nød at hun ikke var fri.
Ikke akkurat en prisvinnende historie. Dette er hva folkene på Narrative Science og andre liker det er oppe imot. Hvis de vil ha den Pulitzer, har de en lang vei å gå.
Skriftene ligner maleriet, hvor fantasien og lurene i det menneskelige sinn tar form på måter som er vanskelig å forstå noen ganger. Det er så mange andre lovende områder der kunstig intelligens kan brukes Giovanni Idili of OpenWorm: Hjerner, ormer og kunstig intelligens Giovanni Idili of OpenWorm: Hjerner, ormer og kunstig intelligens Simulere en menneskelig hjerne er en måte å gå ut, men en åpenbaring, kildeprosjektet tar viktige første skritt ved å simulere nevrologi og fysiologi til et av de enkleste dyrene som er kjent for vitenskapen. Les mer, det virker nesten feil å forsøke å erstatte menneskelig kreativitet med den kalde, tomme logikken til programvare. Men hvis det er noen gang et område som vil være den siste grensen til kunstig intelligens - så vil det bli det.
Hva synes du om forsøket på å bruke bots til å skrive som mennesker? Hvor langt i fremtiden tenker du på at dette blir ekte? Del dine tanker og innsikt i kommentarfeltet nedenfor.
Image Credit: Robot hånd Via Shutterstock, Sergey Nivens / Shutterstock, Catmando / Shutterstock
Utforsk mer om: Kunstig intelligens.