AVX2

  • ХабрахабрФото Шпаргалка по SIMD-инструкциям, теперь и для .NET Core

    Шпаргалка по SIMD-инструкциям, теперь и для .NET Core

    Ни для кого не секрет, что в дотнет завезли интринсики. Я писал об этом и до того, как они появились и после. Плюс ещё посты на Хабре, например этот. И всё, казалось бы, замечательно, если бы не одно «но»: называются эти интринсики по-дотнетовски, а совсем не так как в ассемблере или C++. Из-за этого трудно воспользоваться уже готовым векторизованным кодом,…

    Читать далее »
  • ХабрахабрФото XXH3: новый рекордсмен по скорости хеширования

    XXH3: новый рекордсмен по скорости хеширования

    Бенчмарки сделаны в программе SMHasher на Core 2 Duo 3,0 ГГц Они применяются там, где важна скорость и нет смысла применять медленные MD5 или SHA1. На Хабре неоднократно рассказывали про некриптографические хеш-функции, которые на порядок быстрее криптографических. Например, для построения хеш-таблиц с хранением пар ключ-значение или для быстрой проверки контрольной суммы при передаче больших файлов. Хотя изначально эти хеши задумывались…

    Читать далее »
  • ХабрахабрФото [Перевод] Разновидности SIMD

    [Перевод] Разновидности SIMD

    Во время разработки meshoptimizer частенько возникает вопрос: «А может этому алгоритму использовать SIMD?» К сожалению, SIMD может сделать код менее переносимым и менее ремонтопригодным. Библиотека ориентирована на производительность, но SIMD не всегда обеспечивает значительные преимущества по скорости. Когда первостепенное значение имеет производительность, приходится разрабатывать и поддерживать отдельные реализации SIMD для наборов инструкций SSE и NEON. Поэтому в каждом конкретном случае…

    Читать далее »
  • ХабрахабрФото Ускоряем неускоряемое или знакомимся с SIMD, часть 2 — AVX

    Ускоряем неускоряемое или знакомимся с SIMD, часть 2 — AVX

    Поэтому продолжаем знакомиться с SIMD, но уже с современной его частью — AVX. Предыдущая часть вызвала бурную дискуссию, в ходе которой выяснилось, что AVX/AVX2 на самом деле есть в десктопных CPU, нет только AVX512. А так же разберём некоторые комментарии: медленнее ли _mm256_load_si256, чем прямое обращение к памяти? влияет ли на скорость использование AVX команд над SSE регистрами? действительно ли…

    Читать далее »
  • ХабрахабрФото [Перевод] Абсурдно быстрое кодирование и декодирование base64

    [Перевод] Абсурдно быстрое кодирование и декодирование base64

    Об авторе: Дэниель Лемер — профессор компьютерных наук в Университете Квебека (Канада). Его исследования затрагивают производительность программного обеспечения и инженерию данных Компьютеры хранят данные как поток бит. Как изображения, аудио- или видеофайлы, так и бинарные файлы могут содержать практически любую последовательность бит. Однако мы часто используем текстовые форматы; например, веб-страницы и электронные письма должны быть в текстовом формате. Как же…

    Читать далее »


Кнопка «Наверх»