machine translation

  • ХабрахабрФото Дообучение модели машинного перевода

    Дообучение модели машинного перевода

    Разработчики машинного перевода часто рассказывают об использовании предварительно обученных моделей. Захотелось дообучить такую модель самому, но пришлось приложить усилия, чтобы найти понятный пример. Поэтому после того, как код заработал, решил поделиться скриптами. В качестве предварительно обученной модели взял m2m100. Дообучал языковую пару с языка хауса на английский. Для этого воспользовался корпусом mafand. Весь код завязан на работу с моделями и…

    Читать далее »
  • ХабрахабрФото Первый нейросетевой переводчик для эрзянского языка

    Первый нейросетевой переводчик для эрзянского языка

    Эрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей. Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и…

    Читать далее »
  • ХабрахабрФото Курс Natural Language Processing (обработка естественного языка)

    Курс Natural Language Processing (обработка естественного языка)

    Всем привет! Huawei Russian Research Institute (Huawei RRI) в рамках программы взаимодействия с ведущими российскими университетами (МФТИ, МГУ, МГТУ им. Н. Э. Баумана) представляет открытый курс “Natural Language Processing” или “Обработка естественного языка”, который пройдет на площадке московского корпуса Физтеха. Наш курс является открытым, будем рады видеть всех заинтересованных. В рамках курса запланировано 11 занятий. Каждое занятие состоит из лекции…

    Читать далее »
  • ХабрахабрФото Natural Language Processing. Итоги 2019 и тренды на 2020

    Natural Language Processing. Итоги 2019 и тренды на 2020

    Всем привет. С некоторым запозданием я решил опубликовать эту статью. Каждый год я стараюсь подвести итоги произошедшего в области обработки естественного языка (natural language processing). Не стал исключением и этот год. BERTs, BERTs are everywhere Начнем по порядку. Если вы не уехали в глухую Сибирскую тайгу или отпуск на Гоа на последние полтора года, то вы наверняка слышали слово BERT.…

    Читать далее »
  • ХабрахабрФото Deep Learning in Natural Language Processing

    Deep Learning in Natural Language Processing

    Лаборатория нейронных сетей и глубоко обучения МФТИ открывает курс Deep Learning in Natural Language Processing. Он стартует 21 февраля и будет проходить каждую среду в 19:00 в 105 БК, необходимо зарегистрироваться. Длительность курса — 10 занятий, их проведёт сотрудник лаборатории Валентин Малых (madrugado). Курс открыт для всех желающих углубить свои знания в Deep Learning и Natural Language Processing. Занятия также…

    Читать далее »


Кнопка «Наверх»