Hva er det beste gratis OCR eller ICR-programmet for manuskript transkripsjon?

Hva er det beste gratis OCR eller ICR-programmet for manuskript transkripsjon? / Spør ekspertene

Javier spør:

Jeg er forfatter av noveller og historier. Jeg leter etter et gratis program for optisk tegngjenkjenning (OCR) eller Intelligent Character Recognition (ICR) for å skanne mine gamle manuskripter fra bilder eller fotografier, slik at jeg kan konvertere dem til Microsoft Word-filer.

Er det noen gratis og nøyaktige programmer som kan gjøre dette? Dessverre har jeg ikke en skanner, men jeg har tilgang til et digitalkamera med en 20 megapikslers oppløsning.

Kannons svar:

Som du allerede har nevnt, finnes det flere typer tegngjenkjenningsteknologier som automatisk kan konvertere håndskrevet eller skrevet skrift til digitale tegn. Nøyaktigheten av denne typen programvare varierer sterkt mellom ulike implementeringer. Noen konverterer på brev til bokstav, og andre kan konvertere hele ord. Det er tre generelle kategorier av denne programvaren:

  • Optisk tegngjenkjenning (OCR)
  • Intelligent Character Recognition (ICR)
  • Intelligent Word Recognition (IWR)

Optisk karaktergjenkjennelse

I sannhet er OCR et generisk begrep, og ofte er alle metodene som er skissert i denne artikkelen referert til som OCR - Wikipedia, men gir OCR sin egen klassifisering, men moderne implementeringer pleier å klø sammen flere metoder. Så hva gjør det? OCR konverterer individuelt-typede eller håndskrevne bokstaver til digitale tegn. Så ser programvaren på et dokument og forsøker deretter å konvertere det til vanlig tekst ved å gjette hva hvert tegn er.

Programvaren er ikke perfekt. OCR-programvare kan feiltolke individuelle tegn med lignende utseende, noe som resulterer i feilstavede ord og unøyaktige utganger. Mesteparten av tiden kan brukerne kopiere teksten generert av et OCR-program til en tekstbehandler og automatisk fikse stavefeilene. Ofte vil feil vises som lignende tegn. For eksempel brevet “d” kan være representert som “cl”.

Men når det kommer til håndskrevne tekster, gjør OCR ikke veldig bra. I det minste er flertallet av de kostnadsfrie implementasjonene tragisk dårlige. Det er noen kommersielle produkter som kan egentlig Negl håndskrevet transkripsjon, men deres prissetting plasserer dem helt utenfor rekkevidde for allmennheten. For eksempel er det Lexmarks ReadSoft OCR-programvare. Denne bedriften-eneste programvaren koster tusener av dollar.

Intelligent karaktergjenkjenning

ICR er en delmengde av OCR som spesialiserer seg på å konvertere håndskrevet tekst til individuelle digitale tegn. Gitt at notater og manuskripter er håndskrevne, er et ICR-program det mest nyttige. Jeg er imidlertid ikke sikker på hvor nøyaktig de kan konvertere tekster skrevet på fremmedspråk, for eksempel spansk. Som med OCR kan brukerne forbedre kvaliteten på de utgitte teksten ved å kopiere dem til en tekstbehandler med stavemåtekorrigering slått på, og deretter korrekturlesing for hånd.

Intelligent Word Recognition

Den siste utviklingen av OCR og ICR er Intelligent Word Recognition-programvare. I stedet for å gjenkjenne individuelle tegn forsøker det å oversette hele håndskrevne ord. I likhet med OCR og ICR mislykkes intelligent ordgjenkjenning ofte, og krever at brukeren manuelt retter feilen.

Hva er den beste gratis OCR-programvaren?

Tesseract

Det er mange alternativer tilgjengelig. Tesseract er sannsynligvis det beste åpen kilde (og gratis) OCR-programvare der ute. Etter min kunnskap ser det bare på individuelle tegn og ikke hele ord.

Fordi du bruker Microsoft Word (som har den beste og mest tilpassbare stavekontrollen Hvordan stave og grammatikk Sjekk inn Microsoft Word Hvordan stave og grammatikk Kontroller i Microsoft Word Du kan tilpasse Microsoft Words innebygde stavekontroll og grammatikkkontrollverktøy for å møte dine behov. Du kan til og med bruke AutoCorrect for å øke hastigheten på skrivingen. Les mer i virksomheten) Du kan bare kopiere hele teksten til Word og deretter kjøre stavekontroll for å rydde opp stavfelter.

Tesseract er faktisk en OCR-motor som går fra kommandolinjen. Med mindre du er villig til å håndtere vanskeligheten med å bruke et kommandolinjeverktøy, vil du sannsynligvis ønske å installere noe mer brukervennlig. Det er en nedlastbar “front-end” (eller et grafisk brukergrensesnitt) som lar deg bruke Tesseract som et dra-og-slipp-verktøy: PDF OCR X. Først installerer du programvaren, og kjører den deretter. Du ser da et vindu:

Så dra og slipp bare bildefilen på vinduet. Når bildet laster, kjør OCR-transkripsjonsprogramvaren. Det kan ta et minutt eller så.

Dessverre viste det seg at det var helt utilstrekkelig for håndtering av teksten. Slik ser det ut etter at du har hentet tekst fra dokumentet:

Microsoft OneNote

Siden det ser ut til at du allerede bruker Microsoft Office, er det beste alternativet trolig også fra Microsoft. Jeg kommer til å gjette at du eier en kopi av Microsoft Office, som inkluderer OneNote. Dette er utstyrt med ganske avansert OCR-teknologi.

Også på både iOS og Android er det også helt gratis Microsoft Office-objektiv, som kan konvertere JPEG (og andre bildeformater) direkte til tekst. Hva gjør mobilversjonene så fantastiske er at du kan skyte et bilde, laste det opp til Microsofts cloud computing system, og deretter kjøre tekstutvinningen fra OneNote på et skrivebord.

Prosessen er ganske enkel. Ta først et bilde av teksten din. Hvis du har bestemt deg for å bruke OneNote-appen, må du bare lagre filen på OneDrive-kontoen din. Hvis ikke, overfør bildet til datamaskinen din og slipp på OneNote.

Høyreklikk deretter på bildet og velg Kopiere Tekst fra Bilde fra kontekstmenyen.

Deretter høyreklikker du på en tom del av OneNote (eller i et tekstavlesingsprogram) og lim inn teksten. Den utgitte teksten fra dokumentet ser slik ut:

Dessverre gjør resultatene fra OneNote ikke hvor som helst i nærheten av en god jobb, produserer fullstendig nonsens. Dette kan skyldes en kombinasjon av faktorer, for eksempel et forvrengt bilde eller skriving som ikke er gjort i en rett linje, eller bare fordi programvaren ikke er god nok.

Google Keep

Akkurat nå er den beste løsningen for OCR på håndskrevne dokumenter knyttet til maskinlæring: Spesielt dyplæring. Dyplæring er en sofistikert metode for å trene en datamaskin for å utføre oppgaver som tidligere kun menneskelige utmerkede seg, for eksempel ansiktsgjenkjenning (Picasa gjør ansiktsgjenkjenning. Slik bruker du ansiktsgjenkjenning i Picasa Nettalbum. Slik bruker du ansiktsgjenkjenning i Picasa Nettalbum Les mer , tro det eller ei). Google kjøpte nylig DeepMind som utvikler dyp læringsteknologi. Kule forskningsprosjekter som kan forandre fremtiden. Kule forskningsprosjekter som kan forandre fremtiden. Vil megakorporasjoner som Google, Microsoft, IBM og Intel fortsette å gi fremtidige generasjoner verden vi kan bare forestille deg nå? Disse spennende forskningsprosjektene sier at det er et løfte de vil beholde. Les mer . Dette nøkkeloppkjøpet hadde stor effekt: Microsoft mister Google i OCR Microsoft vs Google - Hvem leder det kunstige intelligensløpet? Microsoft vs Google - Hvem leder det kunstige intelligensløpet? Kunstig intelligensforskere gjør konkrete fremskritt, og folk begynner å snakke seriøst om AI igjen. De to titanene som leder kunstig intelligensløp er Google og Microsoft. Les mer . Foreløpig tilbyr Google en av de mest avanserte (og gratis) metodene: Google Keep.

Google Keep (som vi først vurderte i 2013 Enkle notater på farten: Google Keep for Android Omtalte enkle notater på farten: Google Keep for Android Anmeldt Det er noen fantastiske notatbøker der ute, men her er en som fortjener en nærmere titt : Google Keep, en notatbehandler som har både en flott Android-app og en glatt webapp. Les mer) tilbyr også en mobilversjon av appen deres til Android. Som med OneNote kan du skyte bildet og overføre det direkte til Googles sky. Bare dra bildet på Google Keep-vinduet. Klikk deretter på menyknappen (tre vertikale punkter) og velg Ta tak i bildetekst fra kontekstmenyen.

Slik ser det ut etter at teksten er hentet:

Google Keep Wins

Som du ser, dominerer Google Keep på konkurransen. Resultatene kan forbedres ytterligere ved å bruke et bilderedigeringsverktøy 10 Gratis Photo Editor-verktøy for å få mest mulig ut av bildene dine 10 Gratis Photo Editor-verktøy for å få mest mulig ut av bildene dine Uansett hva som skjedde med alle øyeblikksbildene du har tatt tidligere ? Hvis du har planer og ideer, her er noen flotte Windows og noen kryssplattformverktøy for å behandle dem med. Les mer for å øke kontrasten og rette opp bildet.

Forhåpentligvis hjelper disse alternativene. Hvis du trenger flere OCR-alternativer, kan du se de 5 beste OCR-verktøyene. De 5 beste OCR-verktøyene for å trekke ut tekst fra bilder De 5 beste OCR-verktøyene for å trekke ut tekst fra bilder Når du har stammer av papir, hvordan får du alt som skrives ut Tekst konvertert til noe som et digitalt program vil kunne gjenkjenne og indeksere? Hold en god OCR-programvare i nærheten. Les mer, for mer informasjon.

Utforsk mer om: OCR, Transkripsjon.