Главная » Хабрахабр » [Перевод] Нейросети не понимают, что такое оптические иллюзии

[Перевод] Нейросети не понимают, что такое оптические иллюзии

Системы машинного зрения могут распознавать лица на одном уровне с людьми и даже создавать реалистичные искусственные лица. Но исследователи обнаружили, что эти системы не могут распознать оптические иллюзии, а значит, и создать новые.

Хотя оно развивалось в определённой окружающей среде миллионы лет, оно способно на такие задачи, которые никогда не попадались ранним зрительным системам. Зрение человека – удивительный аппарат. Хорошим примером будет чтение, или определение искусственных объектов – машин, самолётов, дорожных знаков, и т.п.

Исследователи определили уже много вариантов, в которых эти иллюзии заставляют людей неправильно оценивать цвет, размер, взаимное расположение и движение. Но у зрительной системы есть хорошо известный набор недостатков, воспринимаемых нами, как оптические иллюзии.

Поэтому будет очень полезно придумать способ находить новые иллюзии, которые помогут изучить ограничения этой системы.

Концентрические круги? Сами по себе иллюзии интересны тем, что дают представление о природе зрительной системы и восприятия.

В последние годы машины научились распознавать объекты и лица на изображениях, а потом создавать похожие изображения. Здесь нам должно пригодиться глубинное обучение. Легко представить, что система машинного зрения должна суметь распознавать иллюзии и создавать свои собственные.

Эти ребята попробовали провернуть такое дело, но обнаружили, что всё не так просто. Тут на сцену выходят Роберт Уильямс и Роман Ямпольский из Университета Луисвилля в Кентукки. Почему же? Существующие системы машинного обучения не способны выдавать собственные оптические иллюзии – по крайней мере, пока.

Недавние подвижки в глубинном обучении основаны на двух прорывах. Сначала общая информация. Первый — доступность мощных нейросетей и парочка программных трюков, позволяющих им хорошо обучаться.

К примеру, чтобы научить машину распознавать лица, требуются десятки тысяч изображений, содержащих чётко размеченные лица. Второй – создание огромных по объёму размеченных баз данных, на базе которых машины способны обучаться. Что ещё более впечатляет, пара сетей – т.н. С такой информацией нейросеть может научиться распознавать характерные закономерности лиц – два глаза, нос, рот. генеративно-состязательная сеть (ГСС) – способны научить друг друга создавать реалистичные и совершенно искусственные изображения лиц.

Вычислительных мощностей достаточно, а подходящих баз данных не хватает. Уильямс и Ямпольский задумали научить нейросеть определять оптические иллюзии. Поэтому их первой задачей стало создание базы данных оптических иллюзий для тренировки.

«Статических оптических иллюзий существует всего несколько тысяч, а количество уникальных видов иллюзий очень мало – возможно, пара десятков», — говорят они. Это оказалось сложно сделать.

«Создание модели, способной научиться на таком небольшом и ограниченном наборе данных, станет огромным скачком вперёд для генеративных моделей и понимания зрения человека», — говорят они. А это серьёзное препятствие для современных систем машинного обучения.

Затем они создали ГСС, которая должна самостоятельно создавать оптические иллюзии. Поэтому Уильямс и Ямпольский собрали базу данных из более чем 6000 изображений оптических иллюзий, и натренировали нейросеть распознавать их.

«После семи часов тренировок на Nvidia Tesla K80 ничего ценного создано не было», — говорят исследователи, открывшие базу данных для использования всеми желающими. Результаты их разочаровали.

«Единственные из известных нам оптических иллюзий были созданы эволюцией (к примеру, рисунки глаз на крыльях бабочки) или художниками-людьми», — указывают они. Результат, тем не менее, интересный. И в обоих случаях люди играли решающую роль в обеспечении обратной связи – люди могут видеть иллюзию.

«Маловероятно, что ГСС сможет научиться обманывать зрение, не понимая принципов, лежащих в основе иллюзий», — говорят Уильямс и Ямпольский. А системы машинного зрения не могут.

Многие исследователи создают нейросети, ещё сильнее напоминающие зрительную систему человека. Это может оказаться сложной задачей, поскольку между зрительными системами человека и машины есть критически важные различия. Возможно, одной из интересных проверок для этих систем будет то, смогут ли они увидеть иллюзию.

Так что, пока оптические иллюзии остаются бастионом человеческого восприятия, неподвластным машинам. А пока Уильямс и Ямпольский не проявляют оптимизма: «Судя по всему, набора данных с иллюзиями может быть недостаточно для создания новых иллюзий», — говорят они.


Оставить комментарий

Ваш email нигде не будет показан
Обязательные для заполнения поля помечены *

*

x

Ещё Hi-Tech Интересное!

Расширяйте кругозор, Холмс! Или зачем физикам скрипка и кулинарные навыки

О современной литературе, философии и политике он, по-видимому, не знал почти ничего.… Однако мое изумление достигло апогея, когда я случайно обнаружил, что он не знаком с теорией Коперника и не представляет себе, как устроена Солнечная система.… «Но не знать о ...

Спам звонки. Можно ли с ними бороться?

Доброго времени суток, Хабр. Есть несколько способов бороться со спамными звонками на мобильный телефон, но бывают такие ситуации, когда это практически невозможно. Я расскажу свой случай о систематических звонках со скрытого номера.Все мы привыкли раз в какое-то время получать спамные ...