🔴 Сложный ⏱️ 25 минут

Типы задач машинного обучения

🎯 Зачем это нужно?

Представь, что ты открыл Netflix 📺. Система сразу показывает тебе фильмы, которые могут понравиться. Или заходишь в Instagram - и лента заполнена постами твоих друзей, а не случайного контента. А когда играешь в шахматы против компьютера, он учится на твоих ходах и становится сильнее!

Все эти “умные” системы решают РАЗНЫЕ типы задач. И чтобы не изобретать велосипед каждый раз, программисты классифицировали все задачи ML на несколько основных типов. Сегодня разберемся, какие они бывают!

📚 История вопроса

Классификацию задач ML придумали не сразу. В 1950-х Артур Самуэль (создатель термина “машинное обучение”) заметил: одни программы учатся на готовых примерах, другие - сами ищут закономерности, третьи - методом проб и ошибок.

Интересный факт: первая программа для игры в шашки (1959 г.) сама себя обучала, играя против копий! Это был один из первых примеров reinforcement learning 🎲.

💡 Интуиция

Думай о задачах ML как о трёх типах обучения в школе:

🎓 Обучение с учителем = обычные уроки с преподавателем У тебя есть учебник с примерами и правильными ответами. Решаешь задачи, сверяешься с ответами, учишься.

🔍 Обучение без учителя = самостоятельное исследование
Тебе дали кучу документов без объяснений. Нужно самому найти закономерности, сгруппировать по темам, понять структуру.

🎮 Обучение с подкреплением = изучение через игру Играешь в новую игру без инструкций. Делаешь ход - получаешь очки или теряешь жизнь. Постепенно понимаешь правила и стратегию.

[МЕДИА: image_01] Описание: Схема трех типов машинного обучения с аналогиями из школьной жизни Промпт: “educational infographic showing three types of machine learning with school analogies, teacher-student for supervised, research for unsupervised, gaming for reinforcement learning, modern flat design, vibrant colors”

📐 Формальное определение

1️⃣ Supervised Learning (Обучение с учителем)

Дано: Набор пар (x, y), где x - входные данные, y - правильный ответ Цель: Найти функцию f: x → y, которая предсказывает ответы для новых данных

Подтипы:

Классификация: y ∈ {класс₁, класс₂, …} (дискретные значения)
Регрессия: y ∈ ℝ (непрерывные значения)

2️⃣ Unsupervised Learning (Обучение без учителя)

Дано: Только входные данные X = {x₁, x₂, …, xₙ} Цель: Найти скрытую структуру в данных

Подтипы:

Кластеризация: разбить данные на группы
Снижение размерности: найти важные признаки
Поиск аномалий: найти выбросы

3️⃣ Reinforcement Learning (Обучение с подкреплением)

Дано: Среда, состояния S, действия A, награды R Цель: Найти оптимальную стратегию π: S → A для максимизации E[∑R]

[МЕДИА: image_02] Описание: Математические определения трех типов ML с примерами функций Промпт: “technical diagram showing mathematical definitions of supervised, unsupervised, and reinforcement learning with function notation, clean academic style, suitable for advanced students”

🔍 Примеры с разбором

Пример 1: Классификация спама 📧

Задача: Определить, является ли письмо спамом

Входные данные: текст письма, отправитель, время
Выход: “спам” или “не спам” (2 класса)
Обучение: на размеченных письмах (млн примеров в Gmail)

# Упрощенный пример
def classify_spam(email_text):
    # Модель обучена на парах (текст, метка)
    spam_score = model.predict(email_text)
    return "spam" if spam_score > 0.5 else "normal"

Пример 2: Рекомендации музыки 🎵

Задача: Spotify предлагает новые треки

Входные данные: история прослушиваний пользователей
Выход: кластеры пользователей со схожими вкусами
Метод: кластеризация (unsupervised)

Логика: “Пользователи в одном кластере → похожие вкусы → рекомендуем треки из плейлистов соседей”

Пример 3: Игровой ИИ в Dota 2 🎮

OpenAI Five (2018) - бот, который обыграл чемпионов мира:

Состояние: позиции героев, HP, золото, предметы
Действия: движение, атака, использование способностей
Награда: +1 за победу, -1 за поражение, промежуточные за убийства
Обучение: 10 000 лет игрового времени за 10 месяцев!

[МЕДИА: image_03] Описание: Сравнительная таблица трех примеров разных типов ML Промпт: “comparison table showing spam classification, music recommendations, and game AI examples, highlighting input-output patterns, clean educational layout with icons”

🎮 Практика

Базовый уровень 🟢

Задание 1: Определи тип задачи YouTube показывает рекламу, подходящую конкретному пользователю.

💡 Подсказка

Есть ли у YouTube данные о том, какая реклама "правильная" для каждого пользователя?

✅ Ответ

Supervised Learning (классификация). Обучается на данных: (профиль пользователя, клики по рекламе)

Задание 2: Классифицируй задачу Банк ищет подозрительные транзакции среди миллионов операций.

💡 Подсказка

Сколько % транзакций мошеннические? Легко ли их заранее разметить?

✅ Ответ

Unsupervised Learning (поиск аномалий). Мошеннических операций мало (~0.1%), сложно размечать

Задание 3: Опознай тип ML Беспилотный автомобиль учится парковаться в гараже.

✅ Ответ

Reinforcement Learning. Машина пробует разные маневры, получает награду за успешную парковку

Задание 4: Найди подтип Предсказание цены квартиры по площади, району и этажу.

Продвинутый уровень 🟡

Задание 5: Смешанные типы TikTok определяет, какое видео показать пользователю. Какие типы ML здесь используются?

✅ Ответ

1) Supervised: предсказание времени просмотра по признакам видео 2) Unsupervised: кластеризация пользователей по интересам 3) Reinforcement: A/B тесты для оптимизации ленты

Задание 6: Выбери архитектуру У тебя есть 100 000 фотографий котов и собак с подписями. Хочешь создать приложение для определения животного на фото. Какой тип задачи и какие метрики использовать?

Задание 7: Оцени сложность Сравни сложность задач: а) Определить язык текста (русский/английский/китайский) б) Сгенерировать субтитры к видео в) Найти оптимальный маршрут доставки по 100 адресам

Челлендж 🔴

Задание 8: Гибридный подход
Опиши, как Netflix использует ВСЕ три типа ML для рекомендаций. Приведи конкретные примеры каждого типа.

Задание 9: Этические вопросы Система найма сотрудников обучена на данных за 10 лет. Какие проблемы могут возникнуть? К какому типу ML это относится?

⚠️ Частые ошибки

❌ Ошибка: “Если есть данные с ответами, то это точно supervised learning” ✅ Правильно: Не всегда! В reinforcement learning тоже есть “ответы” (награды), но они приходят с задержкой и зависят от последовательности действий 💡 Почему: В supervised learning ответ известен сразу для каждого примера. В RL награда зависит от всей стратегии

❌ Ошибка: “Unsupervised learning не может использовать обратную связь” ✅ Правильно: Может! Например, рекомендательные системы используют клики как неявную обратную связь 💡 Почему: “Без учителя” ≠ “без обратной связи”. Просто нет явных правильных ответов

❌ Ошибка: “Reinforcement learning только для игр” ✅ Правильно: RL используется в рекламе, финансах, роботехнике, управлении ресурсами 💡 Почему: Везде, где есть последовательность решений с отложенным эффектом - подходит RL

❌ Ошибка: “Регрессия всегда точнее классификации” ✅ Правильно: Это разные задачи! Регрессия предсказывает числа, классификация - категории 💡 Почему: Нельзя сравнивать точность предсказания “цены дома” и “породы собаки”

❌ Ошибка: “Кластеризация всегда находит правильные группы” ✅ Правильно: Алгоритм найдет кластеры, но их интерпретация - задача человека 💡 Почему: Машина видит математические закономерности, а не смысл данных

🎓 Главное запомнить

✅ Supervised: учимся на примерах с правильными ответами (классификация + регрессия) ✅ Unsupervised: ищем скрытые паттерны без готовых ответов (кластеризация + снижение размерности)
✅ Reinforcement: учимся через взаимодействие со средой и получение наград ✅ Выбор типа зависит от наличия размеченных данных и постановки задачи

🔗 Связь с другими темами

Откуда пришли: урок 301 заложил математические основы ML Куда идём: следующие уроки покроют конкретные алгоритмы для каждого типа задач Практическая связь: понимание типов задач критично для выбора правильного подхода в реальных проектах

Понял тему? Закрепи в боте! 🚀

Попрактикуйся на задачах и получи персональные рекомендации от AI

💪 Начать тренировку