5 безплатни онлайн OCR услуги тествани и прегледани
Имате PDF документ или изображение, което искате да конвертирате в текст? Наскоро някой ми изпрати документ по пощата, който трябваше да редактирам и изпрати с корекции. Човекът не можеше да намери цифрово копие, така че ми беше възложено да превърна целия текст в цифров формат.
Нямаше начин да прекарам часове да пиша всичко обратно, така че в крайна сметка взех хубава висококачествена картина на документа и след това се изгорих през куп онлайн OCR услуги, за да видя кой ще ми даде най-доброто резултати.
В тази статия ще прегледам няколко от любимите ми сайтове за OCR, които са безплатни. Заслужава да се отбележи, че повечето от тези сайтове предоставят основна безплатна услуга и след това имат платени опции, ако искате допълнителни функции, като по-големи изображения, многостранични PDF документи, различни езици за въвеждане и т.н..
Също така е добре да знаете предварително, че повечето от тези услуги няма да могат да съответстват на форматирането на оригиналния ви документ. Това са предимно за извличане на текст и това е всичко. Ако имате нужда от всичко, за да бъде в определено оформление или формат, ще трябва ръчно да го направите, след като получите целия текст от OCR.
В допълнение, най-добрите резултати за получаване на текста ще идват от документи с резолюция от 200 до 400 DPI. Ако имате ниско DPI изображение, резултатите няма да са толкова добри.
На последно място, имаше много сайтове, които тествах, които просто не работят. Ако Google безплатно OCR онлайн, ще видите куп сайтове, но някои от сайтовете в топ 10 на резултатите дори не са завършили реализацията. Някои биха изтекли, други биха допуснали грешки, а някои просто останаха на страницата за конвертиране, така че дори не си спомням тези сайтове..
За всеки сайт тествах два документа, за да видя колко добре ще бъде продукцията. За моите тестове просто използвах моя iPhone 5S, за да направя снимка на двата документа и след това да ги кача директно на уебсайтовете за конвертиране.
В случай, че искате да видите как изглеждат изображенията, които използвах за теста си, прикачих ги тук: Test1 и Test2. Обърнете внимание, че това не са пълни версии на изображенията, взети от телефона. Използвах изображението с пълна резолюция при качването в сайтовете.
OnlineOCR
OnlineOCR.net е чист и прост сайт, който достави много добри резултати в моя тест. Основното, което ми харесва е, че няма тонове реклами навсякъде, което обикновено се случва с тези сайтове с нишови услуги..
За да започнете, изберете файла и изчакайте да приключи качването. Максималният размер на качване за този сайт е 100 МБ. Ако се регистрирате за безплатен профил, получавате няколко допълнителни функции, като например по-голям размер на качване, многостранични PDF файлове, различни езици за въвеждане, повече реализации на час и т.н..
След това изберете езика за въвеждане и след това изберете изходния формат. Можете да избирате от Word, Excel или обикновен текст. Кликнете върху превръщам и ще видите текста, показан в долната част на полето заедно с линк за изтегляне.
Ако искате само текста, просто го копирайте и поставете от кутията. Предлагам ви обаче да изтеглите документа на Word, защото той изненадващо отлично свързва оформлението на оригиналния документ.
Например, когато отворих Word документа за втория си тест, бях изненадан, че документът включва таблица с три колони, точно както в изображението.
От всички сайтове, този беше най-добрият. Заслужава си да се регистрирате, ако имате нужда от много реализации.
За пълнота, аз също ще се свърже с изходните файлове, създадени от всяка услуга, така че можете да видите резултатите за себе си. Ето резултатите от OnlineOCR: Test1 Doc и Test2 Doc.
Обърнете внимание, че когато отваряте тези Word документи на вашия компютър, ще получите съобщение в Word, в което се посочва, че той е от интернет, а редактирането е забранено. Това е напълно добре, защото Word не се доверява на документи от интернет и наистина не е нужно да разрешавате редактирането, ако искате да прегледате документа.
i2OCR
Друг сайт, който даде доста добри резултати, беше i2OCR. Процесът е много подобен: изберете вашия език, файл и след това натиснете Извличане на текст.
Тук ще трябва да изчакате минута-две, защото този сайт отнема малко повече време. Също така, в Стъпка 2, уверете се, че изображението ви се показва отдясно нагоре в прегледа, в противен случай ще получите куп безсмислици като изход. По някаква причина изображенията от моя iPhone се показват в портретен режим на моя компютър, но пейзаж, когато качвах на този сайт.
Трябваше да отворя ръчно изображението в приложение за редактиране на снимки, да го завъртя на 90 градуса, след това да го завъртя обратно в портрет и след това отново да го запазя. След като приключите, превъртете надолу и ще ви покаже преглед на текста заедно с бутон за изтегляне.
Този сайт се справи доста добре с изхода за първия тест, но не го направи добре с втория тест, който имаше оформлението на колоната. Ето резултатите от i2OCR: Test1 Doc и Test2 Doc.
FreeOCR
Free-OCR.com ще вземе вашите изображения и ще ги конвертирате в обикновен текст. Няма опция за експортиране във формат Word. Изберете файла си, изберете език и след това щракнете върху начало.
Сайтът е бърз и ще получите изхода доста бързо. Просто кликнете върху връзката, за да изтеглите текстовия файл на компютъра си.
Както е посочено по-долу, този сайт капитализира всички Т в документа. Нямам представа защо би го направил, но по някаква странна причина и този сайт и NewOCR направиха това. Не е голяма работа да го промените, но това е досаден процес, който наистина не трябва да правите.
Ето резултатите от FreeOCR: Test1 Doc и Test2 Doc.
ABBYY FineReader Online
За да използвате FineReader Online, трябва да се регистрирате за сметка, която ви дава 15-дневна безплатна пробна версия за OCR до 10 страници безплатно. Ако трябва само да направите еднократно OCR за няколко страници, можете да използвате тази услуга. Уверете се, че кликнете върху връзката за потвърждение в имейла за потвърждение, след като се регистрирате.
Кликнете върху Разпознава в горната част и след това щракнете върху Качи , за да изберете файла. Изберете вашия език, изходен формат и щракнете върху Разпознава на дъното. Този сайт има чист интерфейс и няма реклами.
В моите тестове този сайт успя да вземе текста от първия тестов документ, но беше абсолютно огромен, когато отворих Word doc, така че го направих отново и избрах Обикновен текст като изходен формат..
За втория тест с колоните документът на Word беше празен и дори не можех да намеря текста. Не съм сигурен какво се е случило там, но изглежда не може да се справи с нищо друго, освен с прости параграфи. Ето резултатите от FineReader: Test1 Doc и Test2 Doc.
NewOCR
Следващият сайт, NewOCR.com, беше добре, но не беше толкова добър, колкото първият сайт. Първо, има реклами, но за щастие не един тон. Първо изберете файла и след това щракнете върху предварителен преглед бутон.
След това можете да завъртите изображението и да настроите областта, в която искате да сканирате за текст. Много прилича на това как процесът на сканиране работи на компютър с прикачен скенер.
Ако документът има няколко колони, можете да проверите Анализ на оформлението на страницата и ще се опита да раздели текста на колони. Щракнете върху бутона OCR, изчакайте няколко секунди, за да се завърши и след това превъртете надолу до дъното, когато страницата се освежи.
В първия тест той получи целия текст правилно, но по някаква причина капитализира всеки T в документа! Нямаше представа защо ще го направи, но го направи. При втория тест с включен анализ на страницата, той получи по-голямата част от текста, но оформлението беше напълно изключено.
Ето резултатите от NewOCR: Test1 Doc и Test2 Doc.
заключение
Както можете да видите, безплатните не ви дават много добри резултати през повечето време, за съжаление. Първият споменат сайт е най-добрият, тъй като не само успя да разпознае целия текст, но и да запази формата на оригиналния документ..
Ако имате нужда от текст, обаче, повечето от горепосочените сайтове трябва да могат да направят това вместо вас. Ако имате някакви въпроси, не се колебайте да коментирате. Наслади се!