semantic segmentation
-
Хабрахабр
Визуальное RPG с долговременной памятью, генерируемое из 3 нейросетей и LLamы
Языковые модели (NLP) сейчас активно развиваются и находят себе всё больше интересных применений. Начиналась же их эпоха с классики жанра — D&D. Это настольная игра, где несколько друзей или просто знакомых синхронно галлюцинируют, представляя себя командой героев в некоем вымышленном мире. Прав же во внутриигровых выборах тот, кто выкинул большее число на игральной кости. Судить сейчас об их мотивации у…
Читать далее » -
Хабрахабр
Робот-газонокосилка, часть 3. Сегментация травы нейросетью
В этой части мы научим газонокосилку отличать скошенную траву от нескошенной с помощью нейросети. А также определять препятствия, такие как бетонные дорожки, что было невозможно только датчиком расстояния в предыдущей части. Но сначала попробуем определять зеленый цвет травы с помощью OpenCV. Часть 1. Механика и радиоуправлениеЧасть 2. Определение высоты травыЧасть 3. Сегментация травы нейросетьюЧасть 4. Карта газона на визуальных маркерах…
Читать далее » -
Хабрахабр
Обзор на статью Visual Transformers — новый подход к тренировке моделей компьютерного зрения на основе visual tokens
Эта работа интересна тем, что авторы в ней предлагают новый подход к тренировке моделей на изображениях — использовать не только пиксели и конволюции, но ещё и представлять изображения в виде визуальных токенов и тренировать на них трансформеры. По сравнению с использованием просто архитектуры ResNet предложенный подход уменьшает MAC (multiply and accumulate operations) в 6,9 раз и увеличивает топ-1 точность на…
Читать далее »