28.11.2022

Практический подход к пониманию моделей машинного обучения

1 min read

Что такое машинное обучение?
Машинное обучение — это разновидность искусственного интеллекта (ИИ), который может анализировать огромное количество наборов данных и распознавать закономерности в течение короткого периода времени. Машинное обучение дает системе возможность учиться на собственном опыте.
Машинное обучение — это процесс анализа данных, который автоматизирует создание аналитических моделей, когда модели учатся на данных, выявляют и прогнозируют тенденции, а также выносят суждения с минимальным участием человека. Существует три типа техники разработки машин.
Методы разработки машинного обучения
В машинном обучении есть три основных подхода. Они определяются типом ввода или вывода человеческого желания, а также тем, как мы хотим, чтобы программы машинного обучения работали.
Обучение с учителем Модель обучения с учителем начинается со сбора данных и прогнозирует на их основе разумный результат. Чтобы делать прогнозы, он использует прошлые данные. Метод контролируемого обучения используется для генерации известных входных и выходных данных в случае неопределенности. Данные были помечены, и он обучил модель выдавать результат, когда ей подаются некоторые входные данные.

Обучение с учителем может применяться к задачам классификации и регрессии.
Классификационные модели Программа машинного обучения должна сделать вывод на основе наблюдаемых значений и решить, к какой категории относятся новые наблюдения.
Модели регрессии Программа машинного обучения должна оценивать и понимать отношения между переменными. Регрессионный анализ фокусируется на одной зависимой переменной и наборе других изменяющихся переменных, что делает его идеальным для прогнозирования и прогнозирования.

2. Неконтролируемое обучение В моделях машинного обучения мы можем использовать неконтролируемое обучение, когда нет помеченных данных. Это метод извлечения прогнозов из необработанных источников данных. В начале нет упоминания о конкретном исходе. Алгоритмы машинного обучения распознают закономерности в данных и автоматически находят структуру самостоятельно. По сути, он используется для поиска скрытых закономерностей в данных, которые имеют смысл.

Используемые кластеризация и уменьшение размерности находятся в процессе обучения без учителя.
Кластеризация — это процесс группирования наборов схожих данных (на основе определенных критериев). Его можно использовать для разделения данных на несколько групп и выполнения анализа закономерностей для каждого набора данных.
Уменьшение размерности Уменьшение размерности уменьшает количество переменных, которые необходимо учитывать, чтобы получить точные требуемые данные.

3. Обучение с подкреплением связано со структурированными процессами обучения, в которых алгоритму машинного обучения предоставляется набор действий, параметров и конечных значений для работы. Алгоритм машинного обучения пытается изучить различные варианты и возможности после определения правил, мониторинга и оценки каждого результата, чтобы определить, какой из них лучший. Обучение с подкреплением инструктирует Агента учиться методом проб и ошибок. Он берет то, что он узнал в прошлом, и адаптирует свой подход к ситуации, чтобы достичь наилучшего результата.

Обобщенный взгляд на модели машинного обучения с некоторыми примерами, в которых использовался в основном алгоритм:

Наиболее распространенные и популярные алгоритмы машинного обучения:
Чтобы узнать о некоторых популярных алгоритмах, нам нужно работать с набором данных. возьмем набор данных из Kaggle. Ссылка на набор данных цветка ириса приведена ниже:

После импорта и чтения данных мы можем применить к нашим данным какой-то EDA. После EDA мы можем применять алгоритмы к нашему набору данных. Давайте применим популярные алгоритмы к набору данных радужной оболочки глаза.
Модели линейной регрессии, которые показывают отношения между независимой и зависимой переменной, известны как линейные регрессии.

У него две основные цели:
Чтобы установить, существует ли связь между двумя переменными.
Чтобы спрогнозировать или предсказать новые наблюдения.
Линейную регрессию можно рассчитать как Y = A + BX.
здесь Y — зависимая переменная, X — независимая переменная, а A, B — коэффициенты.
Чтобы применить алгоритм линейной регрессии, мы должны выполнить следующие шаги: —
Набор данных цветов ириса имеет несколько значений. Для линейной регрессии мы должны преобразовать ее в отдельные независимые и отдельные зависимые переменные, а для видов мы должны преобразовать категориальные данные в числовые данные, как показано ниже: