Hi-Tech

Основы машинного обучения простым языком

Основы машинного обучения простым языком — Будущее на vc.ru

Свежее

Вакансии

Написать

Уведомлений пока нет

Пишите хорошие статьи, комментируйте,
и здесь станет не так пусто

Войти

Перевод заметки аналитика фармацевтической компании Pfizer Кайла Галлатина.

В закладки

На деле всё гораздо проще. В диалоге об искусственном интеллекте трудно найти середину: СМИ пишут о сенсациях, даже когда разработка не заслуживает внимания, а научная литература порой сбивает с толку своим языком самых мотивированных исследователей. Чтобы в общих чертах понять принцип работы ИИ, рядовому пользователю нужно вспомнить школьный курс математики.

Машинное обучение же позволяет машине «учиться» на данных реального мира, а не действовать в рамках установленных правил. ИИ — любой алгоритм, подражающий человеческому интеллекту, будь то бот в видеоигре или движок AlphaGo. Но что же значит «учиться»?

Geospatial World

Мы можем показать компьютеру входные (x) и выходные (y) данные, а он вычислит, как они связаны. Больше всего мне нравится такое объяснение: машинное обучение есть функция y = mx + b.

Но в конечном итоге он сводится к математической функции. Действительно, нынешний ИИ — чистая математика, иногда очень сложная, требующая обширных знаний в информатике, статистике.

Итак, нам известны x и y, формула тоже дана, осталось отыскать значения m и b.

Чтобы получить y из x, умножим x на единицу (значение m) и прибавим единицу (значение b). Взглянем на таблицу ниже. Располагая значением x, мы сможем определить значение y для всех четырёх примеров. Таким образом, функция принимает вид y = 1x + 1.

Теперь нарисуем график:

Самый замысловатый этап — научить компьютер определению наиболее подходящей функции для описания данных.

Человеку не по силам математика, которая по силам компьютеру

Если для x и y дана лишь одна точка, верная функция будет иметь единственный вид. Стоит помнить: чтобы отыскать качественное отношение, требуется достаточное количество информации, в противном случае оно будет слишком неточным. Но в нашем примере, когда x = 1, а y = 2, функция может принимать вид y = 2x, y = x + 1, y = ([x+1]*5 – 9)⁵ + 1 и так далее.

На графике ниже компьютер определил несколько функций, описывающих наибольшее число точек. К тому же данные далеко не всегда идеальны. Стало быть, модель хороша настолько, насколько хороши обучающие данные.

Пример того, как алгоритм учится определять наиболее точную функцию

Towards Data Science

Но что, если на входе не одна переменная? Функция y = 1x + 1 проста. Человек не может разом охватить миллионы точек данных и вывести функцию, описывающую результат. Что, если на y влияют x¹, x²,…x¹⁰⁰? Эту задачу мы перекладываем на компьютеры.

На практике

Подставим значения в формулу, где: Я работаю в фармацевтике, поэтому давайте представим, что у нас есть база данных, в которой две переменные на входе — радиус и периметр опухоли — и два возможных вывода, качества опухоли: доброкачественная или злокачественная.

  • y — диагноз; если y = 0, опухоль доброкачественная, если y = 1 — злокачественная;
  • x1 — радиус;
  • x2 — периметр;
  • у каждого x есть неизвестный множитель m, назовём его «нечто»;
  • b — неизвестная константа.

Похоже на формулу y = mx + b, не так ли? Как теперь выглядит наше линейное уравнение: диагноз = (нечто1*радиус) + (нечто2*периметр) + b.

Вместо того чтобы самостоятельно высчитывать, на какое нечто нужно помножить переменные для точного диагноза, мы ставим задачу алгоритму. Тут-то мы и выходим за пределы человеческих возможностей. Вот, собственно, что такое машинное обучение.

#машинноеобучение

Блоги компаний

Показать еще

Push-уведомления

{ "page_type": "article" }

["\u041f\u0440\u0438\u043b\u043e\u0436\u0435\u043d\u0438\u0435-\u043f\u043b\u0430\u0446\u0435\u0431\u043e \u0441\u043a\u0430\u0447\u0430\u043b\u0438
\u0431\u043e\u043b\u044c\u0448\u0435 \u043c\u0438\u043b\u043b\u0438\u043e\u043d\u0430 \u0440\u0430\u0437","\u0425\u0430\u043a\u0435\u0440\u044b \u0441\u043c\u043e\u0433\u043b\u0438 \u043e\u0431\u043e\u0439\u0442\u0438 \u0434\u0432\u0443\u0445\u0444\u0430\u043a\u0442\u043e\u0440\u043d\u0443\u044e
\u0430\u0432\u0442\u043e\u0440\u0438\u0437\u0430\u0446\u0438\u044e \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0443\u0433\u043e\u0432\u043e\u0440\u043e\u0432","\u041a\u043e\u043c\u0430\u043d\u0434\u0430 \u043a\u0430\u043b\u0438\u0444\u043e\u0440\u043d\u0438\u0439\u0441\u043a\u043e\u0433\u043e \u043f\u0440\u043e\u0435\u043a\u0442\u0430
\u043e\u043a\u0430\u0437\u0430\u043b\u0430\u0441\u044c \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u044c\u044e","\u041d\u0435\u0439\u0440\u043e\u043d\u043d\u0430\u044f \u0441\u0435\u0442\u044c \u043d\u0430\u0443\u0447\u0438\u043b\u0430\u0441\u044c \u0447\u0438\u0442\u0430\u0442\u044c \u0441\u0442\u0438\u0445\u0438
\u0433\u043e\u043b\u043e\u0441\u043e\u043c \u041f\u0430\u0441\u0442\u0435\u0440\u043d\u0430\u043a\u0430 \u0438 \u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0432 \u043e\u043a\u043d\u043e \u043d\u0430 \u043e\u0441\u0435\u043d\u044c","\u041a\u043e\u043c\u043f\u0430\u043d\u0438\u044f \u043e\u0442\u043a\u0430\u0437\u0430\u043b\u0430\u0441\u044c \u043e\u0442 email
\u0432 \u043f\u043e\u043b\u044c\u0437\u0443 \u043e\u0431\u0449\u0435\u043d\u0438\u044f \u043f\u0440\u0438 \u043f\u043e\u043c\u043e\u0449\u0438 \u043c\u0435\u043c\u043e\u0432","\u0413\u043e\u043b\u043e\u0441\u043e\u0432\u043e\u0439 \u043f\u043e\u043c\u043e\u0449\u043d\u0438\u043a \u0432\u044b\u043a\u0443\u043f\u0438\u043b
\u043a\u043e\u043c\u043f\u0430\u043d\u0438\u044e-\u0441\u043e\u0437\u0434\u0430\u0442\u0435\u043b\u044f"]

Приложение-плацебо скачали
больше миллиона раз

Подписаться на push-уведомления

Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть