Alt du noensinne ønsket å vite om CAPTCHAs, men var redd for å spørre [Teknologi forklart]

Elske dem eller hate dem - CAPTCHAer har blitt allestedsnærværende på Internett. Hva er CAPTCHA uansett, og hvor kom det fra? Ansvarlig for øyebelastning verden over, har den ydmyke CAPTCHA vært sentrum for stor oppmerksomhet som det mest effektive våpenet i kampen mot webspam. Men er de effektive? Er det noen andre typer CAPTCHA annet enn det grunnleggende “vippe hodet, knuse og lese meg”?

Du skal ikke passere (Turing-testen)!

Captcha er oppfunnet av et team av Carnegie Mellon professorer og satt i bruk første gang rundt år 2000 av AltaVista og Yahoo, i et forsøk på å forhindre automatiserte chatbots og URL-innsendinger. Det er faktisk et akronym for Completely ENutomated Public Turing test for å fortelle Computer og Humans ENdel.

For de av dere som ikke vet hva det betyr, kan det bidra til å forklare hva Turing-testen er. Oppkalt etter britisk professor Alan Turing, er Turing-testen standardprøven av an Kunstig intelligens basert maskin, hvorved en maskin kan passere testen, anses å utgjøre intelligent oppførsel. I hovedsak består testen av å snakke med en rekke dommere gjennom et tekstgrensesnitt - hvis dommerne ikke kan fortelle at de snakker med en datamaskin, passerer den testen. Personlig er jeg av den oppfatning at Turing-testen er ubrukelig, på grunnlag av at en delfin heller ikke kunne snakke med et menneske, men vi tilskriver dem en høyere form for intelligent oppførsel. Men jeg går ned.

CAPTCHAen er derfor en automatisert Turing-test. Det finnes en rekke forskjellige måter å gjøre dette på, men den vanligste som vi ser ut til å ha slått seg på, er å presentere brukeren med en forvrengt form for tekst, forutsatt (ofte feilaktig) at ethvert normalt menneske vil kunne dechifrere tekst.

CAPTCHA har utviklet seg over tid, men har til slutt blitt beseiret som vi finner ut senere.

Tekstbasert CAPTCHAs og Re-CAPTCHA-prosjektet

ReCAPTCHA-prosjektet, som nå eies av Google, bestemte seg for at i stedet for inanely dechifiserer kryptisk tekst for ingen virkelig god, presenterte den en fantastisk mulighet til å korrigere manglene på datamaskinbasert Optical Character Recognition. For eldre bøker spesielt, finner datamaskiner det svært vanskelig å gjenkjenne ordene, mens et menneske finner oppgavene trivielle. Kombiner oppgaven med digitalisering av gamle bøker med spamforebygging, og du er på en absolutt vinner.

Men hvis datamaskinen hadde problemer med å anerkjenne ordet i utgangspunktet, hvordan kan det fortelle om det du skrev inn er tull? Enkel - present brukeren med to ord - hvorav en er kjent. Systemet antar at hvis brukeren korrekt skriver det kjente ordet, er sjansene at det ikke-gjenkjennelige ordet også er riktig.

En annen genial ide er å kombinere CAPTCHA med en eller annen form for reklame.

Matematisk problem

OK, bildet er en vits, men i hovedsak er brukeren presentert med et grunnleggende matematisk problem. Vi bruker et lignende system på Answers-siden akkurat nå. Det trenger ikke være vanskelig, bare noen grunnleggende tillegg.

Bildebaserte CAPTCHAer

Så vanskelig som noen av ReCAPTCHA-kodene kan være for deg og jeg noen ganger, er programvare allerede utviklet som kan bryte koden med om en 30% suksessrate - som for en spam-kampanje med millioner av forsøk er ganske akseptabel. Bilder derimot er ekstremt vanskelig å behandle for datamaskiner semantisk. Tenk på et enkelt kattebilde - programmering av en datamaskin for å gjenkjenne et menneskelig ansikt er vanskelig nok, men å skille en katt fra alle de andre dyrene og gjenstandene i verden er ganske mye umulig på dette tidspunktet.

Logikk-basert

Disse er avhengige av logisk og semantisk intelligens om verden, eller bare grunnleggende felles menneskelig fornuft. Noen eksempler kan være:

Identifiser maten i denne listen: asfalt, bacon, sky, dolk.
Identifiser våpenet i denne listen: asfalt, bacon, sky, dolk.
Hvor mange dører er på en fire-dørs bil?
Hva er det tredje ordet i denne setningen?
Hva er igjen hvis du fjerner B fra ABC?

En god plugin for å integrere slike tester i WordPress-kommentarsystemet, er WP-Gatekeeper, forresten.

De-CAPTCHA-tjenester

Det triste faktum er at mens CAPTCHAer er et nødvendig onde, blir de lett overveldet av spammere i dag. Mens noen spammere faktisk har utviklet sofistikert programvare som kan etterligne det menneskelige øye og hjernen til å dekode som et menneske gjør, er sannheten langt enklere og mer forferdelig. Hvorfor utvikle dyr programvare når du kan betale noen pennies for å gjøre CAPTCHA for deg? Den nåværende laveste prisen er 1,39 USD for 1000 CAPTCHAer, med en 98% nøyaktighet, og tjenester som Death By Captcha har utviklet utførlige APIer for utviklere å bruke. Den eneste personen som blir bremset av CAPTCHAs i dag, er du!

The Future Of The Captcha

Som alt annet i livet, er CAPTCHAer ikke ugjennomtrengelige for hacking eller spamming. Som nye og mer geniale tester blir utarbeidet, vil stadig mer sofistikerte måter å bryte dem bli utviklet - og løsningen av å betale noen andre til å gjøre dem for deg, kan aldri bli beseiret. Likevel er det vårt ansvar som webutviklere og administratorer for å holde spammere unna våre nettsteder uten forringende brukeropplevelse.

Er du sjokkert over å lære hvor billig en CAPTCHA kan bli beseiret for? Har du sett noen andre typer CAPTCHA'er ute i naturen som imponerte deg? Gi oss beskjed i kommentarene! Vær også sikker på å sjekke alle de morsomme bildene som er merket “captcha” over på Geeky Fun.

Bildekreditt: xkcd

Utforsk mer om: Spam.

« Alt du ikke visste du ville vite om gresskar Alt du noensinne ønsket å vite om personvern på jobb »