Главная » Хабрахабр » Как с помощью дата-майнинга мы уменьшали брак на металлообрабатывающем заводе — на установке охлаждения

Как с помощью дата-майнинга мы уменьшали брак на металлообрабатывающем заводе — на установке охлаждения


МКС-5000, часть линии

Эта сталь идёт на строительство судов и на менее романтичные вещи в промышленности вроде труб. Одна огромная российская производственная компания куёт сталь, которой знаменита наша страна. У них установлена современная линия МКС-5000, комплекс для производства крупнолистового проката.

Но все заготовки разные, и некоторые результаты выходят с линии бракованными. Линия управляется вендорской коробкой типа «чёрный ящик», которая знает усреднённые значения параметров для в среднем оптимального получения результата. Их пытаются править с помощью мужика с болгаркой или отправляют назад в переплавку в зависимости от типа брака.

Мы пришли туда со своей математикой для двух задач: Самая больная точка — устройство контролируемого охлаждения (один из 14 этапов линии).

  1. Поиска заготовок, которые надо снимать с линии, — с ними при охлаждении в любом случае получится брак.
  2. Подбора индивидуальных параметров охлаждения под каждую заготовку.

Результат — из тех 5% брака мы умеем «спасать» 42% заготовок и знаем про заведомый брак (до окончания обработки на линии) на ещё примерно 35% заготовок. Это 10 миллионов рублей на партию.

Что происходит на линии

Первоначально заготовка (обрезанный сляб) загружается в нагревательную печь, где разогревается до температуры порядка 1300 °C. Греется сляб примерно 6 часов. Затем он очищается от окалины гидравлическим сбивом, проходит через клеть с усилием 12 тысяч тонн и установку предварительной правки. Получается лист. Затем в установке контролируемого охлаждения за счёт сверхточных режимов термомеханической обработки раскат приобретает равномерные свойства и микроструктуру по всей длине и ширине листа. После механической правки и участка замедленного охлаждения листы поступают на инспекцию геометрии и в устройство ультразвукового контроля внутренних дефектов. После чего признанные качественными листы подвергаются окончательной резке и сортировке.

Постановка задачи

Лист может быть бракован в следующих случаях:

  1. Неверные геометрические параметры (что-то пошло не так, и его перекосило).
  2. Плены (расслоения металла), трещины, пузыри, раковины и прочие дефекты, вызванные газами в нагретом состоянии металла.

Именно минимизация повреждений из-за действия газов в раскалённой заготовке позволяет больше всего повлиять на снижение брака. Редко когда заготовка приходит сразу бракованной — обычно лист повреждается при охлаждении.

На выходе есть данные контроля качества, которые также дают хорошую картину результата. На входе у нас есть набор датчиков, который позволяет всесторонне оценить заготовку.

Напомню, линия уже хороша в состоянии от вендора, но автоматика просто использует некую эвристику «так лучше всем листам» без учёта их индивидуального состояния. Гипотеза в том, что, анализируя первое, второе и режимы работы агрегатов, можно выявить закономерности в том, что именно происходит не так.

Честно говоря, они нам не очень-то доверяли поначалу: это абсолютно нормально, что на тяжёлых производствах металлурги считают тех, кто не видел всего этого вживую несколько лет, немного клоунами. Поскольку интеграция всего этого — процесс длительный, специалисты предприятия сказали следующее: если мы сможем предсказывать брак заранее без ложноположительных срабатываний, то этого будет достаточно для того, чтобы доказать им, что дата-майнинг может быть использован на производстве.

Результаты первого этапа:

— Модель прогноза аномалий (брака).
— Оценка степени влияния отдельных признаков (параметров) на нарушение температурного режима.
— Оценка степени влияния различных комбинаций признаков на нарушение температурного режима.
— Абсолютную величину влияния изменений каждого единичного признака на температуру (коэффициенты модели линейной регрессии).

Что дал завод

Завод предоставил нам огромный массив данных.

  • Полные исторические данные АСУ ТП первого уровня о параметрах и сигналах для 1000 произведённых листов (в т. ч. показания 2000 датчиков SCADA, используемой заводом).
  • Усреднённые и нормализованные данные второго уровня АСУ ТП, сформированные в базу данных Oracle.
  • Примеры данных термосканера.
  • Отчёты третьего уровня АСУ ТП.

Задача попала в нашу команду R&D. Мы вооружились очень быстро, развернули свой движок машинного обучения в своём же облаке (быстрое прототипирование за 2 недели для доказательства коммерческих гипотез — это наш конёк).

Утром мы получили массив, вечером над ним уже работали скрипты, отлаженные в нашей же среде для разработчиков облака.

В результате была выбрана модель линейной регрессии, показавшая наилучший предсказательный эффект: Для выполнения задачи первого этапа пилота опробованы различные методы машинного обучения для проведения анализа важности признаков.

— достоверность классификации (Precision) — 90%;
— точность попаданий (Recall) — 60%.

Если он чуть более холодный, чем требуется, почти гарантированно будет брак. Выяснилось, что очень многое зависит от того, с какой температурой лист покидает установку контролируемого охлаждения (УКО). Выявили ещё ряд параметров, с которыми корреляция была больше 0,7.

Изученная выборка состояла из данных первого уровня IBA, данных второго уровня АСУТП, данных логов управляющей модели SMS-Siemag и данных третьего уровня. Второй вопрос был такой: а почему некоторые листы выходят из УКО чуть более холодными? Их интуитивные эмпирические модели оказались достаточно точными. Потом мы обсудили свои гипотезы с экспертами завода, которые интуитивно знают, где будет брак, а где нет. В итоговой обучающей выборке осталось 197 различных параметров после удаления малозначимых (отсеянных на первом этапе) и редких.

На втором этапе задача решалась как классификация (прогноз возникновения брака) по различным сценариям: На предыдущем этапе анализа данных большее внимание было уделено моделированию процесса охлаждения и построению регрессионных моделей.

— Классы +25°, -25°, +40°, -40° без объединения и удачные охлаждения.
— Классы +25°, -25° и удачные охлаждения.
— Классы +40°, -40° и удачные охлаждения.

Наилучшим методом, опробованным нами для классификации, показал себя метод XGBoost:

— достоверность классификации (Precision) — 98,8%;
— точность попаданий (Recall) — 42,1%.

Эти параметры в дальнейшем могут быть улучшены благодаря обучению модели на новых данных в процессе использования.

Получилось!

Когда по конвейеру едет заготовка, которая в конце окажется браком (50 листов на тысячу), мы детектируем её заранее в 42% случаев (21 лист из тысячи). Ложноположительных срабатываний пока нет.

Практический результат — экономия более 10 миллионов рублей с одной партии металлических листов.

Следующая задача — законченное комплексное решение, которое можно будет тиражировать на предприятиях данного типа. Результат — готовое ядро промышленной системы, способной в случае высокой вероятности брака самостоятельно выставлять нужные параметры охлаждения. То есть интеграция с узлами линии.


Логическая схема целевой комплексной системы предиктивного анализа

Для этого сетевой уровень может быть представлен любой глобальной сетью внешнего оператора связи, а уровень процессинга — облачным сервисом. Хочется отметить, что мы сознательно проектировали решение таким образом, чтобы сделать его максимально гибким и независимым от информационной инфраструктуры предприятия. Хотя весь комплекс можно реализовать на самом предприятии.

То есть никаких чёрных ящиков с хардкодом — всё можно менять «на лету», в том числе чистить данные. Итак, на уровне процессинга в безопасном и отказоустойчивом облаке размещается кластер «озера данных» (Data Lake), куда стекаются все собранные с объекта управления необходимые нам данные.

Итого: 3 недели на доказательство и первые коммерческие результаты.

Где ещё это применимо

Такие же проекты мы можем быстро сделать для снижения уровня брака на основе анализа входных параметров изделий для аграрных предприятий, производства автомобилей, производителей двигателей и турбин, самолётостроения, судостроительной сферы, станкостроения. Лучше всего дата-майнинг подходит для оценки обработки деталей, обточки, выплавки, закалки, сборки двигателей, сборки деталей. Везде можно существенно снизить брак, оценивая параметры с помощью датчиков на входе и имея обучающую выборку.

Если интересно получить оценку по вашему производству, пишите на GShatirov@technoserv.com. И да, мы можем за пару дней оценить возможный коммерческий эффект (это бесплатно) и собрать ядро по типу, как описано выше (это платно, но довольно быстро и доступно в сравнении с интеграцией).

Потому что они быстрые, результативные и удивительно хорошие для нашей личной кармы — видно, как математика экономит огромные деньги. И да, мы как разработчики очень любим такие проекты.


Оставить комментарий

Ваш email нигде не будет показан
Обязательные для заполнения поля помечены *

*

x

Ещё Hi-Tech Интересное!

KDD 2018, день второй, семинары

Побывал на двух таких тусовках. Сегодня на KDD 2018 день семинаров — вместе с большой конференцией, которая начнется завтра, несколько групп собрали слушателей по некоторым специфичным темам. Анализ временных рядов С утра хотел пойти на семинар по анализу графов, но ...

Zabbix на стероидах: как устроена единая платформа мониторинга Сбертеха

Привет, Хабр! Меня зовут Сергей Прутских, я руковожу направлением мониторинга компании «Сбербанк-Технологии». Основная задача нашей организации — разработка и тестирование программных продуктов для Сбербанка. Для этого в компании сосредоточена крупная ИТ-инфраструктура — 15 тысяч серверов разделены примерно на 1500 тестовых ...