cdi

  • ХабрахабрФото Как посчитать «похожесть» номеров в паспортах. И найти одинаковые даже с опечатками

    Как посчитать «похожесть» номеров в паспортах. И найти одинаковые даже с опечатками

    Очевиднейший способ найти одинаковые клиентские карточки — сравнить паспорта или другие документы, удостоверяющие личность. Продукты HFLabs ищут дублированных клиентов в базах федеральных компаний. На ручной разбор из-за опечатки в номере уходили даже те карточки, у которых совпадали ФИО и адреса́ проживания. Раньше мы сравнивали номера документов строго: одинаковые — отлично, нет — извините. Такой подход излишне нагружал персонал заказчиков. Рассказываю, как работает алгоритм. Поэтому мы с головой залезли…

    Читать далее »
  • ХабрахабрФото Миграция данных в кровавом энтерпрайзе: что анализировать, чтобы не завалить проект

    Миграция данных в кровавом энтерпрайзе: что анализировать, чтобы не завалить проект

    И не только собрать, а еще очистить от дублей и мусора. Типичный проект системной интеграции для нас выглядит так: у заказчика вагон систем для учета клиентов, задача — собрать клиентские карточки в единую базу. Чтобы на выходе получились чистые, структурированные, полные карточки клиентов. Для начинающих поясню, что миграция идет по такой схеме: источники → преобразование данных (отвечает ETL или шина) → приемник. Самое обидное, что этого можно было избежать.Работали…

    Читать далее »


Кнопка «Наверх»