data

  • ХабрахабрФото [Перевод] Kindle собирает подозрительно много информации

    [Перевод] Kindle собирает подозрительно много информации

    Я люблю читать и у меня есть несколько моделей Kindle, от самого первого до Paperwhite, они мне все нравятся. Однако, ввиду своей профессии, я привык следить за потенциальными угрозами. Технически, Амазон владеет контентом который вы просматриваете. Они даже могут отобрать его в любой момент. Было не мало случаев, когда Амазон удалял книгу с устройства пользователя. Случалось, что Амазон блокировал аккаунт…

    Читать далее »
  • ХабрахабрФото Apache Airflow: делаем ETL проще

    Apache Airflow: делаем ETL проще

    Привет, я Дмитрий Логвиненко — Data Engineer отдела аналитики группы компаний «Везёт». Я расскажу вам о замечательном инструменте для разработки ETL-процессов — Apache Airflow. Но Airflow настолько универсален и многогранен, что вам стоит присмотреться к нему даже если вы не занимаетесь потоками данных, а имеете потребность периодически запускать какие-либо процессы и следить за их выполнением. И да, я буду не…

    Читать далее »
  • ХабрахабрФото Лучшие data-продукты рождаются в полях

    Лучшие data-продукты рождаются в полях

    Большинство наших интернет-заказов собираются с торговых залов магазинов, а не со складов. Это приводит к ошибкам между тем, что показывается на сайте, и тем, что мы можем реально собрать в интернет-заказ.Из-за высокой скорости оборота товаров в магазинах и сложности систем управления стоком возникают ошибки, которые можно обнаруживать автоматически. Опираясь на наши знания систем и используя социальный инжиниринг, мы предложили решение, которое позволяло бы автоматически находить проблемные товары и корректировать их сток перед публикацией на сайте. Меня зовут Марина…

    Читать далее »
  • ХабрахабрФото К чему может привести ослабление уровня изоляции транзакций в базах данных

    К чему может привести ослабление уровня изоляции транзакций в базах данных

    Всем привет. На связи Владислав Родин. В настоящее время я являюсь руководителем курса «Архитектор высоких нагрузок» в OTUS, а также преподаю на курсах, посвященных архитектуре ПО.Помимо преподавания, как вы могли заметить, я занимаюсь написанием авторского материала для блога OTUS на хабре и сегодняшнюю статью хочу приурочить к запуску курса «PostgreSQL», на который прямо сейчас открыт набор. Введение В прошлый раз…

    Читать далее »
  • ХабрахабрФото К чему может привести ослабление уровня изоляции транзакций в базах данных

    К чему может привести ослабление уровня изоляции транзакций в базах данных

    Всем привет. На связи Владислав Родин. В настоящее время я являюсь руководителем курса «Архитектор высоких нагрузок» в OTUS, а также преподаю на курсах, посвященных архитектуре ПО.Помимо преподавания, как вы могли заметить, я занимаюсь написанием авторского материала для блога OTUS на хабре и сегодняшнюю статью хочу приурочить к запуску курса «PostgreSQL», на который прямо сейчас открыт набор. Введение В прошлый раз…

    Читать далее »
  • ХабрахабрФото [Перевод] Почему нам нужен DevOps в сфере ML-данных

    [Перевод] Почему нам нужен DevOps в сфере ML-данных

    Развертывание машинного обучения (machine learning, ML) в продакшн – задача нелегкая, а по факту, на порядок тяжелее развертывания обычного программного обеспечения. Как итог, большинство ML проектов так никогда и не увидят света — и продакшена — так как большинство организаций сдаются и бросают попытки использовать ML для продвижения своих продуктов и обслуживания клиентов. Насколько мы можем видеть, фундаментальное препятствие на…

    Читать далее »
  • ХабрахабрФото Quartet 9: Allegro | Производительность

    Quartet 9: Allegro | Производительность

    Когда создавалась библиотека для валидации данных quartet были поставленны следующие цели-ориентиры: TypeScript Краткость Простота Производительность В этой статье я хотел бы рассмотреть производительность quartet и её причины. Будем исследовать этот аспект в сравнении между quartet и другой намного более популярной ajv. Hello world Напишем простейшую проверку — является ли значение строкой "Hello World!". Для того, чтобы сравнить библиотеки валидации необходимы…

    Читать далее »
  • ХабрахабрФото Огромный открытый датасет русской речи версия 1.0

    Огромный открытый датасет русской речи версия 1.0

    Подробнее о нашей мотивации и о том, как всё начиналось,можно прочитать в этой статье — Огромный открытый датасет русской речи. В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. 0. С тех пор наш проект прошел через ряд масштабных изменений, мы в три раза увеличили количество данных, повысили их качество, добавили лейблы…

    Читать далее »
  • ХабрахабрФото Огромный открытый датасет русской речи

    Огромный открытый датасет русской речи

    Специалистам по распознаванию речи давно не хватало большого открытого корпуса устной русской речи, поэтому только крупные компании могли позволить себе заниматься этой задачей, но они не спешили делиться своими наработками. Мы торопимся исправить это годами длящееся недоразумение. Итак, мы предлагаем вашему вниманию набор данных из 4000 часов аннотированной устной речи, собранный из различных интернет-источников. Подробности под катом. 3: Вот данные…

    Читать далее »
  • ХабрахабрФото GitLab в NAS

    GitLab в NAS

    При наличии работоспособного NAS с докером, установка Gitlab не представляет особых сложностей. И показывает как просто возможно манипулировать сервисами, на уже готовой платформе, даже построенной самостоятельно, без команды разработчиков, специально подогнанных ОС и магазинов приложений. Эта статья является лишь наглядным примером в рамках цикла про NAS. Почему Gitlab? Существует несколько систем для управления Git-репозиториями. Из них достаточно зрелыми являются... Bitbucket…

    Читать далее »


Кнопка «Наверх»