BERT

Хабрахабр
Лида Шиндлер31.07.2023
0 0

Bercut птица гордая, не пнешь…

Эта статья о моем опыте импортозамещения в сфере сертифицированного измерительного оборудования, а именно использование приборов Bercut‑ETX 10G компании ООО «НТЦ‑Метротек». Полагаю, что информация в статье будет любопытна коллегам трудящимся в близких областях. Прибор Bercut ETX 10G компании "НТЦ-Метротек" Здравствуйте, меня зовут Денис Шехалев. Работаю в сфере разработки систем радиосвязи, радионавигации, радиолокации и т.д. В профессиональных кругах известен под ником des00. При…
Читать далее »
Хабрахабр
Марк Левин15.07.2023
0 0

Нейронные сети врываются в медицину

Доброго времени суток habr, на связи Николай Иванов, студент-магистр 1 курса Сколтеха факультета Data Science. С почином, так как это моя первая, и, надеюсь, не последняя статья на habr. С того момента как я познакомился с областью Deep Learning прошло уже около двух лет. С самого начала мне была интересна область обработки естественного языка (Natural Laguage Processing, NLP), о некоторых…
Читать далее »
Хабрахабр
Марк Левин08.04.2023
0 2

[Перевод] Начинаем работу с PyTorch 2.0 и Hugging Face Transformers

В этом посте разберем работу с PyTorch 2. 0 и Hugging Face Transformers на примере fine-tune модели BERT для классификации текста. PyTorch 2. 0 лучше по производительности, скорости работы, более удобный для Python, но при этом остается таким же динамическим, как и ранее. Разберем следующие шаги: Настройка окружения и установка PyTorch 2. 0. Загрузка и подготовка датасета. Fine-tune и оценка…
Читать далее »
Хабрахабр
Лида Шиндлер13.03.2023
0 0

Джон Кармак взялся за сильный ИИ — и у него особый подход. Список фундаментальной литературы для начала

В рубрике «Выдающиеся программисты 21 века» уже была статья про гения программирования Джона Кармака, создателя движков для Doom, Quake и других культовых игр. Потом он занялся разработкой ракет (они в Armadillo Aerospace реализовали вертикальную посадку раньше SpaceX), а затем — систем VR, софта для Oculus Rift и других устройств. Сейчас началась четвёртая фаза в его карьере. В интервью изданию Dallas Innovates…
Читать далее »
Хабрахабр
Andy25.01.2023
0 0

Как можно применить генерацию изображений в химии для предсказания наноматериалов

Когда я со своими коллегами с направления Химия и ИИ начинал делать этот проект, в мире был в самом разгаре интерес к таким системам генерации изображений как Stable Diffusion, DALL-E и Midjourney. Именно тогда мы решили совместить модели обработки естественного языка (такие как BERT) и системы генерации изображений и применить все это в химическом домене. В итоге мы создали прототип системы, которая может из методики синтеза какого-либо наноматериала генерировать его изображение,…
Читать далее »
Хабрахабр
Марк Левин10.12.2022
0 1

Введение в библиотеку Transformers и платформу Hugging Face

Исходники: https://github.com/huggingface/transformersДокументация: https://huggingface.co/docs/transformers/main/en/index Платформа Hugging Face это коллекция готовых современных предварительно обученных Deep Learning моделей. А библиотека Transformers предоставляет инструменты и интерфейсы для их простой загрузки и использования. Это позволяет вам экономить время и ресурсы, необходимые для обучения моделей с нуля. Модели решают весьма разнообразный спектр задач: NLP: classification, NER, question answering, language modeling, summarization, translation, multiple choice, text generation.…
Читать далее »
Хабрахабр
Andy04.12.2022
0 0

Обучение Russian SuperGLUE моделей с помощью библиотеки DeepPavlov

Соревнования GLUE и SuperGLUE В последние годы соревнования GLUE и SuperGLUE на английском языке стали стандартным бенчмарком для определения возможностей универсальных языковых моделей, таких как BERT, RoBERTa в решении широкого круга задач обработки естественного языка, в том числе задач с недостаточной обучающей выборкой. Соревнования GLUE/SuperGLUE представляют собой наборы задач NLP на основе ранее представленных датасетов. Академическое сообщество NLP довольно быстро…
Читать далее »
Хабрахабр
Andy06.11.2022
0 0

Умные субтитры

Сегодня я вам расскажу о своем методе для изучения иностранных языков. С чего начать изучение нового языка? Чаще всего люди на раннем этапе используют стандартный лексико-грамматический метод с доминированием письменного языка, который показал себя медленным и весьма скучным — вам чаще всего нужна зашкаливающая мотивация, чтобы не бросить где-то посередине. Я предлагаю начать сразу с видео: Видео просто интересно смотреть…
Читать далее »
Хабрахабр
Ксюша Родионова08.10.2022
0 0

Как мы доработали чат-бота «Дану» и сделали её проницательнее и сообразительнее

Привет! Меня зовут Даир, я Data Scientist. Эту статью мы писали вместе с Санжаром, моим коллегой, который тоже занимался проектом. Мы расскажем, как научили понимать любые клиентские запросы уже разработанным ранее в Beeline чат-бота. Фраза «понимание клиента» для нас значит следующее: клиент пишет текстовый запрос с описанием своей проблемы, если чат-бот может уловить суть проблемы, ее тематику и намерение, мы…
Читать далее »
Хабрахабр
Стас Молотов15.09.2022
0 0

Самая большая BERT-подобная модель на русском, которая поместится на ваш компьютер

Привет, это снова Максим Рябинин, исследователь в Yandex Research. В прошлом году я рассказывал на Хабре о том, как вместе с Hugging Face, Университетом Торонто и волонтёрами мы обучили state-of-the-art модель для бенгальского языка и написали об этом статью на конференцию NeurIPS. Теперь хотим поделиться новым результатом: оказывается, технологии для обучения на нестабильном железе находят приложение и внутри привычных всем…
Читать далее »