Главная » Хабрахабр » Как мы делали книжный сканер для судов

Как мы делали книжный сканер для судов

Она скрипела, шипела и давила книгу. Началось всё с того, что однажды мы увидели гигантскую хреновину (иначе не скажешь), которая выглядела один в один, как гидравлический пресс какого-нибудь завода. Вокруг бегали специально обученные операторы и шарахались от каждого её движения.

Потому что тогда были разработаны первые сканеры для библиотек, и их с тех пор не особо модифицировали. Выяснилось, что разные архивы, библиотеки, суды и другие структуры закупают сканеры, или, скажем так, классические решения, которые по уровню начинки очень напоминают 90-е годы.

Задачей сканера было механически выровнять сканируемый материал на плоскости, а потом отсканировать.

С тех пор поменялись две вещи:
— Подходы к конструированию электроники.
— Подходы к машинному зрению.

Первый опыт: датчики давления

Гипотеза: надо прижать книгу к стеклу не со всей дури, сколько есть, а до безопасного давления для руки. Поставить датчики и просто снимать с них показания для подъёмного стола. Это снизит страхи операторов и травматизм.

Второй опыт: выравнивание изображения

С этим результатом мы пришли к одному из заказчиков из судебной сферы. Сшитые документы в судах (чаще всего судебные дела) очень толстые. Такие же кипы документов бывают у инженеров-строителей и в разных архивах.

В конце концов, даже с обычного планшета можно сегодня сфотографировать документ и сразу получить его в виде почти что ксерокопии. Гипотеза: можно выравнивать очень многое не вручную, а с помощью машинного зрения. Чем сканер хуже?

Мы дописали софт, и там появились всякие повороты и наклоны автоматом и с подсказки оператора.

Вот что вышло:

Потом ещё игрались с настройкой предельного значения силы прижима:

Третий опыт: не надо прижимать

У нас на входе в офис стоит 3D-сканер лица, который умеет строить 3D-модель лица по одной фотографии. Делает он это с помощью проектора сетки: сравнивая наложение сетки на лицо, он вычисляет геометрию этого лица. Следующая гипотеза была логична: а зачем прижимать документ, если достаточно спроецировать на него лазерные метки?

Оказалось, достаточно лазерных полосок — вот таких:

Сверху стоит камера, которая снимает.

По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.

Вот что получается: Затем можно выполнить «восстановление» геометрии до того уровня, когда лазерные линии в результате снова будут прямыми.

Вот, собственно, конец истории.

Когда страница сыплется в труху от неаккуратного прикосновения пальцами, прижать её к плоской поверхности — это всё равно что сразу уничтожить. Задача, кстати, оказалась очень актуальной для случаев, когда приходится сканировать очень ветхие и разноформатные сшитые документы, чертежи, книги.

Результат

У нас получилось сделать нужное решение и пустить его в серию просто потому, что, видимо, прочим игрокам рынка было неинтересно или не очень выгодно, чтобы сканеры были дешёвыми и работали быстро. Наши сканеры по сочетанию цена–эффект и цена–качество вышли очень и очень хороши.

Опыт работы с похожими изображениями мы получили, когда распознавали по стране данные сельскохозяйственной переписи. Откуда растут ноги? Плюс у нас есть лаборатория робототехники, где можно быстро собрать прототип любого устройства, которое только возникнет в наших воспалённых мозгах. Тогда надо было разбирать рукописный шрифт: планшеты обходчикам дали только на следующей переписи. Мы загубили некоторое количество материалов, пока не подобрали правильную модель подъёма стола, долго ковырялись с лазерами, но нашли то что нужно. Собственно, так и произошло.

И сэкономили. Ну и мы — интегратор большого размера, поэтому, когда пришли к одному из заказчиков и показали наш результат, к нам прислушались.

Вот три поколения наших сканеров и принципы работы:

Сканер с верхним прижимом:

Сканер с прижимом снизу:

Сканер без прижима:

Ссылки


Оставить комментарий

Ваш email нигде не будет показан
Обязательные для заполнения поля помечены *

*

x

Ещё Hi-Tech Интересное!

Перевезти дата-центр за 14 400 секунд

Всем знакома пословица «Один переезд равен двум пожарам». Смысл этой народной мудрости в том, что процесс переезда сопряжен со стрессами, суетой, переживаниями и, конечно, беготней, которые бывают и при пожаре, а подчас и с утратами ценного имущества. К тому же, ...

Дорожная карта математических дисциплин для машинного обучения, часть 1

Вместо предисловия Допустим, сидя вечерком в теплом кресле вам вдруг пришла в голову шальная мысль: «Хм, а почему бы мне вместо случайного подбора гиперпараметров модели не узнать, а почему оно всё работает?»Это скользкий путь — вы думаете, что достаточно пары ...