@werner en andere geïnteresseerden:
De meeste OCR programma's converteren van je afbeelding/scan een tekst zonder de originele lay-out. Dat kan beter zijn in bepaalde situaties, maar vaak ook niet. PDFScanner werkt anders. Kort gezegd maakt het je afbeelding selecteerbaar. Daarbij worden alle lay-outs en afbeeldingen behouden. Nadeel hiervan is dat gepixeleerde tekst gepixeleerd blijft, waardoor het minder makkelijk leest. (en het ziet er natuurlijk niet uit, zo'n pixel-tekst) Ik denk dat het technisch wel mogelijk is om deze tekst te vervangen door echte vector-tekst, maar dat doet het programma niet. Ook behouden de bestanden de originele grootte (in Mb's) dankzij de lay-out en afbeeldingen dit kan soms ook niet handig zijn. Je kan het natuurlijk altijd kopiëren naar in een teksteditor programma, maar plak dan zonder originele stijl (het programma probeert namelijk ook de grootte en basislijn van verschillende woorden te behouden).
Je kan vervolgens de nieuwe versie opslaan in verschillende kwaliteiten, zodat je de grootte in Mb's kan bepalen. Het is dan natuurlijk wel zo dat, hoe lager de kwaliteit, hoe meer gepixeleerde tekst je krijgt.
De manier van PDFScanner is handig, als je lay-out wilt behouden en/of wilt kunnen zoeken in een pdf. Het zou wel een grote toevoeging zijn als de afbeelding-tekst wordt vervangen door vector-tekst en plaatjes gedetecteerd kunnen worden.
Hoop dat jullie er wat aan hebben.
Groeten,
Maikel