compression

  • ХабрахабрФото Как сжать модель fastText в 100 раз

    Как сжать модель fastText в 100 раз

    Модель fastText — одно из самых эффективных векторных представлений слов для русского языка. Однако её прикладная польза страдает из-за внушительных (несколько гигабайт) размеров модели. В этой статье мы показываем, как можно уменьшить модель fastText с 2.7 гигабайт до 28 мегабайт, не слишком потеряв в её качестве (3-4%). Спойлер: квантизация и отбор признаков работают хорошо, а матричные разложения — не очень.…

    Читать далее »
  • ХабрахабрФото Обфускация данных для тестов производительности

    Обфускация данных для тестов производительности

    Пользователи ClickHouse знают, что его главное преимущество — высокая скорость обработки аналитических запросов. Но как мы можем выдвигать такие утверждения? Это должно подтверждаться тестами производительности, которым можно доверять. О них мы сегодня и поговорим. Как и сейчас, тогда нас больше всего интересовала скорость работы данных сервиса Яндекс.Метрика. Такие тесты мы начали проводить в 2013 году, задолго до того, как продукт…

    Читать далее »
  • ХабрахабрФото Уличная магия сравнения кодеков. Раскрываем секреты

    Уличная магия сравнения кодеков. Раскрываем секреты

    За это время были проведены десятки сравнений с отчетами от 23 до 550+ страниц, количество графиков в последнем сравнении перевалило за 7000, а количество разных феерических случаев за это время окончательно превысило все разумные пределы. В этом году исполняется юбилей — 16 лет, как был запущен сайт compression.ru, на котором автор и сотоварищи организуют сравнения видеокодеков и кодеров изображений. Поскольку…

    Читать далее »


Кнопка «Наверх»