Skip to content

Latest commit

 

History

History
17 lines (12 loc) · 1.21 KB

File metadata and controls

17 lines (12 loc) · 1.21 KB

Программа сканер-распознователь для документов Цели проекта (по уровням сложности):

1 Уровень: Написать обработчик скана документа (любой формат), который находит на нем ключевые слова и посылает их в бд (MongoDB, sql и т.п.). Для распознования используем готовый инструмент Tesseract от Google (https://ru.wikipedia.org/wiki/Tesseract)

2 Уровень: Добавляем много документов при помощи парсинга какого-нить ресурса, например резюме c hh. Добавляем графическую оболочку для программы или делаем из нее веб ресурс.

3 Уровень: Разрабатываем свой собственный алгоритм для распознования символов и прикручиваем к программе (используя теорию распознования образов и собственные идеи-велосипеды)