CUDA

  • ХабрахабрФото Прием всего Bluetooth разом на SDR с CUDA? Легко

    Прием всего Bluetooth разом на SDR с CUDA? Легко

    В последнее время коллеги по "цеху" независимо друг от друга стали спрашивать меня: как получить c одного SDR-приемника одновременно все каналы Bluetooth? Полоса ведь позволяет, есть SDR с выходной полосой 80 МГц и более. Можно, конечно, сделать это на ПЛИС, но время такой разработки будет довольно большим. Мне давно было известно, что сделать такое на GPU довольно просто, но чтобы…

    Читать далее »
  • ХабрахабрФото [Перевод] О появлении поддержки CUDA в WSL 2

    [Перевод] О появлении поддержки CUDA в WSL 2

    Компания Microsoft, откликаясь на многочисленные просьбы пользователей, представила в мае 2020 года на конференции Build новую возможность подсистемы Windows для Linux 2 (Windows Subsystem for Linux 2, WSL 2) — поддержку видеоускорителей. Это позволит запускать в WSL 2 приложения, занимающиеся специализированными вычислениями. Поддержка GPU откроет дорогу профессиональным инструментам, поможет решать в WSL 2 задачи, которые в настоящее время можно решать…

    Читать далее »
  • ХабрахабрФото [Из песочницы] Перенос молекулярной динамики на CUDA. Часть I: Основы

    [Из песочницы] Перенос молекулярной динамики на CUDA. Часть I: Основы

    Цель данной статьи – поднять вопросы распараллеливания кода программы для численного моделирования методом молекулярной динамики (МД) с помощью технологии CUDA. Зачем это вообще нужно, ведь уже существуют программные пакеты по МД, работающие в том числе и на CUDA? Дело в том, что я развиваю свою собственную концепцию «непостоянного поля сил» (non-constant force field), которая не реализована в существующих МД-программах. Переделывать…

    Читать далее »
  • ХабрахабрФото [Перевод] Как GPU-вычисления буквально спасли меня на работе. Пример на Python

    [Перевод] Как GPU-вычисления буквально спасли меня на работе. Пример на Python

    Привет, Хабр! Сегодня мы затрагиваем актуальнейшую тему — Python для работы с GPU. Автор рассматривает пример, тривиальный в своей монструозности, и демонстрирует решение, сопровождая его обширными листингами. Приятного чтения! Никого из нас в той или иной форме не обошел хайп вокруг GPU-вычислений, развернувшийся в последнее время. Прежде, чем вы станете читать далее, поясню: я не эксперт по GPU. Мой путь…

    Читать далее »
  • ХабрахабрФото Вычисления на GPU – зачем, когда и как. Плюс немного тестов

    Вычисления на GPU – зачем, когда и как. Плюс немного тестов

    Всем давно известно, что на видеокартах можно не только в игрушки играть, но и выполнять вещи, никак не связанные с играми, например, нейронную сеть обучить, криптовалюту помайнить или же научные расчеты выполнить. Как так получилось, можно прочитать тут, а я хотел затронуть тему того, почему GPU может быть вообще интересен рядовому программисту (не связанному с GameDev), как подступиться к разработке…

    Читать далее »
  • ХабрахабрФото Новости CLion: релиз 2020.1, пятилетие IDE и онлайн-сессия вопросов и ответов

    Новости CLion: релиз 2020.1, пятилетие IDE и онлайн-сессия вопросов и ответов

    Привет, Хабр! Столько всего хочется сегодня рассказать, что даже сложно выбрать, с чего начать. Так что сначала попробую коротко обо всем самом важном: Продукту CLion вчера исполнилось 5 лет! В честь праздника мы смонтировали небольшую видеоисторию, своеобразное воспоминание и рассказ о том, как же интересно все развивалось для нас эти 5 лет. Сразу предупредим, история на английском: [embedded content] Вчера…

    Читать далее »
  • ХабрахабрФото [Перевод] Простая хэш-таблица для GPU

    [Перевод] Простая хэш-таблица для GPU

    Я выложил на Github новый проект A Simple GPU Hash Table. Это простая хэш-таблица для GPU, способная обрабатывать в секунду сотни миллионов вставок. На моём ноутбуке с NVIDIA GTX 1060 код вставляет 64 миллиона случайно сгенерированных пар ключ-значение примерно за 210 мс и удаляет 32 миллиона пар примерно за 64 мс. То есть скорость на ноутбуке составляет примерно 300 млн…

    Читать далее »
  • ХабрахабрФото Джедайская техника уменьшения сверточных сетей — pruning

    Джедайская техника уменьшения сверточных сетей — pruning

    Приоритет — скорость работы при приемлемой точности. Перед тобой снова задача детектирования объектов. Точность(mAp75) больше 0. Берешь архитектуру YOLOv3 и дообучаешь. Но скорость прогона всё еще низкая. 95. Черт. А под катом рассмотрим Model Pruning — обрезание избыточных частей сети для ускорения Inference без потери точности. Сегодня обойдём стороной квантизацию. Разберем, как сделать это вручную и где можно автоматизировать. Наглядно…

    Читать далее »
  • ХабрахабрФото Посторонись, CUDA — Intel анонсировала 7-нанометровый GPU для дата-центров

    Посторонись, CUDA — Intel анонсировала 7-нанометровый GPU для дата-центров

    По прогнозам аналитиков, рынок дата-центров в ближайшие годы будет расти на 38% в год и за пять лет вырастет до $35 млрд, а самая ресурсоёмкая ниша (по интенсивности вычислений) — глубокое обучение, нейросети и задачи AI. На прошлой неделе гигант микроэлектронной промышленности сделал сразу несколько громких анонсов: Конечно, Intel не собирается равнодушно смотреть, как Nvidia (и AMD, в меньшей степени) со…

    Читать далее »
  • ХабрахабрФото Краеугольные камни уничтожения медленного кода в Wolfram Language: ускоряем код в десятки, сотни и тысячи раз

    Краеугольные камни уничтожения медленного кода в Wolfram Language: ускоряем код в десятки, сотни и тысячи раз

    Скачать файл с кодом и данные можно в оригинале поста в моем блоге Так же и с символьным ядром Wolfram — его чудовищную мощь нужно правильно использовать, а если это делать не так, оно может стать настоящим «злом», замедляющим все очень сильно. Картинка к вебинару и посту взята не просто так: в определенном смысле символьное ядро Wolfram Language можно сравнить…

    Читать далее »


Кнопка «Наверх»