CUDA

  • ХабрахабрФото Гауссов сплэтинг: как это выглядит

    Гауссов сплэтинг: как это выглядит

    Пример работы гауссова сплэтинга. Этот ролик — не видеосъёмка реального мира, а рендер в реальном времени на настольном компьютере Всплеск внимания к технике сплэтинга связан с представленной в августе этого года статьей 3D Gaussian Splatting for Real-Time Radiance Field Rendering [Трёхмерный гауссов сплэтинг для рендера radiance field в реальном времени]. До этого, в июле, эта научная работа исследователей Университета Лазурного берега,…

    Читать далее »
  • ХабрахабрФото Использование Kotlin и WebFlux для выполнения задач ML в Apache Spark на GPU

    Использование Kotlin и WebFlux для выполнения задач ML в Apache Spark на GPU

    Это третья статья по теме реализации масштабируемой системы для выполнения задач распределенного машинного обучения на GPU с использованием Java, Kotlin, Spring и Spark. Список всех статей: Варианты использования Java ML библиотек совместно со Spring, Docker, Spark, Rapids, CUDA Масштабируемая Big Data система в Kubernetes с использованием Spark и Cassandra Использование Kotlin и WebFlux для выполнения задач ML в Apache Spark…

    Читать далее »
  • ХабрахабрФото Simba: Симуляция десятков тысяч частиц в потенциале Леннарда-Джонса на чистом Python с GPU-ускорением

    Simba: Симуляция десятков тысяч частиц в потенциале Леннарда-Джонса на чистом Python с GPU-ускорением

    Добрый день, уважаемые хабровчане. Примерно год назад я начал проект симулятора динамики частиц на Python, используя библиотеку Numba для проведения параллельных расчетов на видеокарте. Сейчас, добравшись до определенной вехи в его развитии, я решил открыть исходный код и выложить его на GitHub для всех, кому интересны подобного рода эксперименты. Самостоятельно потыркать проект можно вот тут: https://github.com/r-aristov/simba-ps В этой статье я…

    Читать далее »
  • ХабрахабрФото [Перевод] Как мы чуть не взломали шифровальщик Phobos с помощью CUDA

    [Перевод] Как мы чуть не взломали шифровальщик Phobos с помощью CUDA

    Последние два года мы работали над доказательством концепции дешифратора для программ-вымогателей семейства Phobos. По причинам, которые мы объясним здесь, он непрактичен. До сих пор у нас не получилось использовать его, чтобы помочь реальной жертве. Но мы решили опубликовать результаты и инструменты в надежде, что кто-то найдёт их полезными, интересными или продолжит исследования. Опишем уязвимость и то, как мы понизили вычислительную…

    Читать далее »
  • ХабрахабрФото [Перевод] Пишем кастомные CUDA-ядра на Triton

    [Перевод] Пишем кастомные CUDA-ядра на Triton

    Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA. Здесь будут изложены основы программирования для GPU и рассказано, как для этой цели используется Triton. Учитывая нынешний успех глубокого обучения и вал исследовательских статей на эту тему, часто возникает такая ситуация: рождается какая-нибудь новая идея, и выясняется, что для нее не поддерживается аппаратное ускорение. Точнее, стоит вам изобрести новую…

    Читать далее »
  • ХабрахабрФото [recovery mode] Запуск кода CUDA на видеокартах AMD

    [recovery mode] Запуск кода CUDA на видеокартах AMD

    Многим известно, что CUDA является наиболее часто используемой платформой для ускорения массовых параллельных вычислений, применяемых в различных практических и исследовательских областях. В 2016 году AMD представила в буквальном смысле клон платформы CUDA — ROCm. Альтернативы модулей CUDA для ROCm можно увидеть в таблице с официального сайта AMD. Таблица соответствия модулей платформ Модуль платформы CUDA Модуль платформы ROCm cuBLAS rocBLAS cuFFT…

    Читать далее »
  • ХабрахабрФото Портирование CUDA проекта на Intel oneAPI DPC++

    Портирование CUDA проекта на Intel oneAPI DPC++

    Наш программный комплекс позволяет проводить численные исследования хаотической динамики в системах, задаваемых обыкновенными дифференциальными уравнениями и точечными отображениями, с использованием методов параллельного программирования и мощных вычислительных серверов. Основные инструменты исследования программного комплекса реализуют методы ляпуновского анализа (расчет двухпараметрических диаграмм показателей Ляпунова и минимальных углов между подпространствами сжатия и растяжения объемов) для выявления и исследования хаотической динамики, а также методы символической…

    Читать далее »
  • ХабрахабрФото Вычисляем на видеокартах. Технология OpenCL. Часть 2. Алгоритмы в условиях массового параллелизма

    Вычисляем на видеокартах. Технология OpenCL. Часть 2. Алгоритмы в условиях массового параллелизма

    Автор курса «Разработчик C++» в Яндекс.Практикуме Георгий Осипов провёл вебинар «Вычисляем на видеокартах. Технология OpenCL». Мы подготовили для вас его текстовую версию, для удобства разбив её на смысловые блоки.1. Зачем мы здесь собрались. Краткая история GPGPU.1a. Как работает OpenCL.1b. Пишем для OpenCL.2. Алгоритмы в условиях массового параллелизма.Не каждый алгоритм ложится на модель массового параллелизма. Возьмём, к примеру, сортировку. Существуют десятки…

    Читать далее »
  • ХабрахабрФото Прием всего Bluetooth разом на SDR с CUDA? Легко

    Прием всего Bluetooth разом на SDR с CUDA? Легко

    В последнее время коллеги по "цеху" независимо друг от друга стали спрашивать меня: как получить c одного SDR-приемника одновременно все каналы Bluetooth? Полоса ведь позволяет, есть SDR с выходной полосой 80 МГц и более. Можно, конечно, сделать это на ПЛИС, но время такой разработки будет довольно большим. Мне давно было известно, что сделать такое на GPU довольно просто, но чтобы…

    Читать далее »
  • ХабрахабрФото [Перевод] О появлении поддержки CUDA в WSL 2

    [Перевод] О появлении поддержки CUDA в WSL 2

    Компания Microsoft, откликаясь на многочисленные просьбы пользователей, представила в мае 2020 года на конференции Build новую возможность подсистемы Windows для Linux 2 (Windows Subsystem for Linux 2, WSL 2) — поддержку видеоускорителей. Это позволит запускать в WSL 2 приложения, занимающиеся специализированными вычислениями. Поддержка GPU откроет дорогу профессиональным инструментам, поможет решать в WSL 2 задачи, которые в настоящее время можно решать…

    Читать далее »


Кнопка «Наверх»