Хабрахабр

Aimybox в поиске: фреймворку для создания голосовых ассистентов нужен мастер iOS

Все вокруг говорят про голосовых помощников, Алису, Google Assistant, что они умеют, чего не умеют… А мы взяли и написали фреймворк для создания мобильных голосовых ассистентов. Да еще и с открытым исходным кодом! Пока мы это сделали только для Android, и теперь ищем крутого iOS-разработчика, кто с легкостью портирует Kotlin код на Swift.
Под катом рассказываем, зачем мы вообще это делаем, что у нас получилось и кого именно мы ищем в команду Aimybox.

Так получилось,

что мы в Just AI уже давно занимаемся говорящими роботами, голосовыми ассистентами и всякими чатботами. Под капотом у нас свои технологии NLP (процессинг естественного языка) и целая платформа, визуальные конструкторы и все-все-все.

Тем временем рынок говорящих устройств

и приложений растет и цветет! Не только Amazon, Google, Яндекс – десятки компаний, от мала до велика, стремятся создать и запустить своего голосового помощника или девайс.

«Зачем? Кому оно надо?»

– восклицают пользователи. А им говорят – «Голосовой помощник – это же круто! Скоро все только с ними и будут разговаривать!». Нет, оно, конечно, удобно. Если помощник умный, понимает всё-всё и работает быстро-быстро. Но если посмотреть на это дело с другой стороны, то мы увидим, что…

Бизнесу нужна одна голосовая функция

Ну или парочка. Но самое важное – нужно быстро и с легкостью добавить голосового помощника в уже существующее мобильное приложение. И чтоб его после этого можно было кастомизировать как угодно.

Есть мобильное приложение, в нем много кнопок и всяких других UI-элементов. Как это выглядит на практике. Что хочет банк? Например, мобильный банк. Вместо трех тапов по экрану – один. Чтобы в приложении появилась кнопочка микрофона, пользователь на нее нажимает и говорит: «Переведи деньги маме». Дальше приложение может просто открыть один из своих экранов с уже заполненным полем получателя.

И приложение открывает карту с банкоматами нашего банка, которые умеют выдавать это дело в радиусе километра от пользователя. Или вот: «Где выдают доллары?».

Что сложного?

Казалось бы, просто добавил кнопку в приложение, подключил какое-нибудь распознавание речи, синтезатор речи, NLP-движок там, сделал красивый GUI со скроллом, с отображением процесса распознавания речи (чтоб не хуже, чем у Google), все синхронизировал, протестировал. Баги отловил. Понял, что все не так просто…

Вот мы и подумали,

что можем создать фреймворк, который всю эту сложность прячет под капот (покрытый тестами) и позволяет разработчику быстро добавить голосового помощника с нужными функциями в его уже работающее мобильное приложение. Мы же давно съели всех собак на пути создания голосовых приложений и знаем, какие там подводные камни.

Что получилось

Открытый, бесплатный, кастомизируемый SDK и готовый голосовой помощник, которого можно добавить в свое мобильное приложение, словно онлайн-чат на сайт. Aimybox! Но при этом не завязываем ассистента на какие-то конкретные движки распознавания, синтеза и NLP. В нем мы воплощаем весь свой опыт создания речевых решений. А еще у него красивый UI! Ну чтобы можно использовать в своем ассистенте любые движки независимо друг от друга, а Aimybox правильно синхронизирует их работу.

Вот что мы рассказывали про Aimybox на конференции по разговорному AI Conversations:

Опенсорс при этом действительно рулит,

потому что сторонние разработчики (те же банки) должны иметь полный контроль над тем, что они встраивают в свои приложения. Это все-таки голосовой интерфейс, мало ли что он там делает внутри…

А там внутри

есть уже готовые модули различных движков распознавания и синтеза речи, NLP и голосовых активаций. Есть готовый кастомизируемый GUI ассистента. Есть документация и пример того, как это все легко и просто внедрить в свое приложение. Но все это пока только под Android!

Поэтому мы ищем iOS-мастера,

который горит желанием не бесплатно присоединиться к проекту и портировать Kotlin на Swift. И готов создать первого в мире открытого голосового ассистента под iOS, код которого нестыдно опубликовать на Github на всеобщее порицание сообщества.

Пиши на che@just-ai.com. Вдруг ты – тот самый, кто умеет читать прекрасный Kotlin и писать не менее прекрасный Swift? Тебя ждет команда Just AI, мир голосовых ассистентов, распознавания и синтеза речи, NLP и отличный повод вписать еще один классный проект в свое портфолио!

Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»