Een gescande tekst kan je niet bewerken en een screenreader kan hem niet lezen want de tekst zit in een afbeelding. Optical character recognition (OCR) kan deze afbeelding omzetten in tekst. Bekende OCR-pakketten zijn Omnipage en Finereader, maar het kan nu dus ook online en gratis.
Even registreren, inloggen en dan klikken op “extract text”. Nu kan je een bestand uploaden met een van de 50 ondersteunde extensies. Kies vervolgens de taal van het document (Nederlands is beschikbaar) en klik op submit. Afhankelijk van de lengte van het document kan het wel even duren, maar na een tijdje kan je het tekstbestand downloaden met het resultaat.
Ik deed de test met een PDF-bestand dat in Adobe Reader enkel vreemde tekens opleverde. Deze OCR-software wist er de tekst uit te halen, niet geheel foutloos maar de inhoud van het document was nu in elk geval duidelijk.
Deze site laat ook toe om een gescande tekst direct om te zetten in een audiobestand, maar gebruikt hiervoor de TTS3000-stemmen. Sommige mensen vinden ze mooi, maar geef mij toch maar mijn vertrouwde screenreader.
4 reacties
1 bert // 26 januari 2007 om 5:50 pm
hey Bart, niet gek, en het werkt ook… min of meer.
k nam een screenshot van jouw pagina hierboven (alleen tekstgedeelte), op de site omgezet van jpg naar pdf, dan inlezen… het resultaat was dit:
0CR
s v e:d o” 9, 9
Een gescande tekst kan je niet bewerken en een screenreader kan hem niet
lezen want de tekst zit In een afbeelding. Optical character recognition (OCR)
kan deze afbeelding omzetten in tekst. Bekende OCR-pakketten zijn
Omnipage en Finereader, maar het kan nu dus ook on line en gratis.
Even en dan klikken op ‘extract text’. Nu kan je een
bestand uploaden met een van de
K
ies
………..
vervolgens de taal van het document (Nederlands is beschikbaar) en klik op
submlt. Afhankelijk van de lengte van het document kan het wel even duren,
maar na een tijdje kan je het tekstbestand downloaden met het resultaat.
Ik deed de test met een PDF-bestand dat in Adobe Reader enkel vreemde
tekens opleverde. Deze OCR-software wist er de tekst uit te halen, niet
geheel foutloos maar de inhoud van het document was nu in eik geval
duidelijk.
Deze site laat ook toe om een gescande tekst direct om te zetten in een
audlobestand, maar gebruikt hiervoor de TTS3000-stemmen. Sommige
mensen vinden ze mooi, maar geef mij’ toch maar mijn vertrouwde
screenreader.
2 karelschiepers-online- » Blog Archive » links for 2007-01-28 // 28 januari 2007 om 6:08 pm
[...] AnySurfer blogt » Gratis OCR on line (tags: scannen software ICT) [...]
3 Lierman // 19 maart 2007 om 4:06 pm
Even geprobeerd met een voorstel polis. Het resultaat was niet goed. Te veel tussenruimten en niet opgeschikt of geordend zoals het voorstel zelf.
Zou er te veel werk aan hebben om te corrigeren.
Groeten,
Pat
4 sharine nicia // 27 mei 2007 om 9:59 pm
wil graag downloaden