Хабрахабр

В Office 365 и другие продукты MS добавят режим голосового ввода-вывода для дислексиков

В первую очередь речь идет о добавлении функций Dictation for Office 365 Desktop Apps в веб-версии продуктов Office 365 для учащихся, а также выход продукта Office Lens на платформе Android, который ранее был доступен только пользователям iOS. Вчера в блоге Microsoft Education Team была опубликована обширная запись, которая презентует голосового ассистента для пакета продуктов Office 365, а также ряд обновлений других продуктов. Все эти активности проходят совместно с организацией Made Dyslexia, в рамках которых технологический гигант планирует создавать учебные материалы и пособия для учеников и студентов, страдающих дислексией. И это не полный список всех «вкусностей» от Microsoft.

Там мы кратко расскажем о новинках от Microsoft без маркетинговых восторгов и обсудим, что вообще происходит и почему когда-то «главная корпорация зла» внезапно оказалась на передовой в области обучения подрастающего поколения.
По приводимой сотрудниками Microsoft статистике практически каждый пятый учащийся (по другим данным — до 15%) страдает той или иной формой дислексии — избирательным нарушением способности распознавать части написанного текста либо писать самостоятельно, без нарушений способности к обучению. Важность публикации MS Education Team еще и в том, что она явно показывает один из приоритетных, а главное потенциально конкурентных направлений деятельности компании — развитие систем голосового ввода и распознавания текстов на пользовательских устройствах для всех существующих экосистем, подробнее о которых под катом. Фактически люди с дислексией обладают нормальным интеллектом, могут и зачастую хотят учиться, но не способны это делать из-за особенностей работы собственного головного мозга. Часто дислексия сопровождается СДВГ (о котором на Хабре можно почитать тут «из первых рук»). То есть, дислексия в современном обществе — это форма инвалидности. Дислексия не является заболеванием мозга в привычном нам виде, поэтому и не лечится. Именно эта категория пользователей называется первоочередной целевой аудиторией новых продуктов компании. Для людей, страдающих от нее, составляют специальные программы обучения, которые в той или иной степени, все же, ограничивают их в возможностях потребления информации.

Как мы говорили выше, Microsoft выносит свой Dictation for Office 365 из приложения в веб-надстройку для Word Online и OneNote Online, который будет работать под любым современным браузером (да, ожидаемого подвоха с прибитым гвоздями функционалом к Edge не произошло, но об этом чуть позже).

Эта разработка организует построчное прочтение текста с математическими формулами для облегчения восприятия такого смешанного текста: Второй важный продукт, который попадает в широкий доступ — Immersive Reader.

Immersive Reader будет доступен на недавно приобретенной Microsoft образовательной платформе Flipgrid, которую компания купила в июле этого года и перевела на бесплатную основу. Все это будет работать в связке с Math Pane, другим обучающим продуктом компании. Проистекает это заболевание из неспособности мозга оценить количество объектов с первого взгляда, то есть без пересчета. Этот вектор развития продуктов Microsoft направлен на борьбу с конкретным видом дислексии — дискалькулией, при наличии которой человек с трудом визуально воспринимает математические выражения и формулы. Как и в случае с дислексией, дискалькулия не влияет на общий уровень интеллекта, но ограничивает человека в направлениях развития и бытовых аспектах.

Ранее продукт был доступен только для iOS. Кроме этого Immersive Reader перекочует и на Andoid, на этот раз в связке с Office Lens — что обеспечивает захват и оцифровку напечатанного текста.

Edge также не обошли стороной нововведения. Все описанные выше «читалки» не ограничиваются английским и имеют обширный перечень поддерживаемых языков, в том числе и русский (ознакомиться можно тут). В свой браузер Microsoft встраивает словарь для ePub и PDF-файлов, а также новый режим построчного просмотра текста.

Что вообще происходит?

Если вы не следите за деятельностью Microsoft или соприкасаетесь с новостями компании только в рамках просмотра презентации xBox на E3, то вполне закономерно, что ваша реакция может быть примерно такой:

Есть четкое ощущение, что Microsoft намеревается выплатить свои кармические долги за предыдущие годы работы (а как минимум верстальщикам за IE6 они задолжали немало), и активно расширяет свое присутствие в образовательной и Open Source-сферах.

Причем если 10-15 лет назад этот процесс начинался с продажи пакетов лицензий для компьютерных классов, то сейчас Microsoft предлагает школам и высшим учебным заведениям комплексные программно-аппаратные решения на базе Windows 10 и Office 365. Кроме платинового членства в Linux Foundation, корпорация активно развивает комплексные решения для учебных заведений всех ступеней образования. Потенциально с гигантом могут тягаться только Amazon и Apple, но обе компании концентрируются на других сегментах рынка и не заинтересованы в образовательном сегменте так, как Microsoft. Объективно, на этом рынке сопоставимого по размерам и ресурсам конкурента у Microsoft нет.

Тот же Flipgrid был выкуплен Microsoft и переведен на бесплатную основу, хотя изначально проект имел коммерческую природу. В последней презентации важно то, что значительная часть презентованных Microsoft новинок будет доступна уже к концу октября, причем бесплатно. Также функция иммерсивнного чтения успешно существует минимум в Word Online (вкладка «Вид») и неплохо читает по-русски.

До сих пор на рынке не было реализовано сколь угодно приличное и при этом простое решение по переводу надиктованного текста в письменный вид. Не стоит забывать о том, что у представленных в рамках образовательных программ Microsoft продуктов и функций, при правильном их внедрении, есть большое будущее. Сейчас Microsoft работают в обратном направлении и специально для дислексиков разрабатывают алгоритмы, которые бы упрощали сложные письменные тексты до более простого уровня, чтобы облегчить их восприятие на слух. Единственный нюанс — устная речь зачастую намного проще, чем письменный текст. Если корпорация сможет в будущем развернуть эти работы на 180 градусов и научить голосовые системы ввода «облагораживать» устную речь до приемлемого для письменной речи уровня, это будет определенно прорыв.

Зачаток этой системы несколько лет назад тестировался в рамках Skype (система синхронного перевода), но из-за своей сложности не получила должного распространения. Другая область применения системы — конвертация голосовых сообщений в текст в рамках общения в мессенджерах. Например потому, что это удобно только для «отправляющей» голосовое сообщение стороны, а вот «принимающий» аудиозапись тратит значительное время на прослушивание. С другой стороны, голосовые сообщения сейчас крайне распространены в социальных сетях или Telegram, но часть аудитории просто отказывается ими пользоваться по ряду причин. Страшно сказать, но функция Voice-to-Text могла бы даже вдохнуть новую жизнь в агонизирующий Skype (после серьезной переработки и облегчения этого продукта, само собой).

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть