Оглавление |
Введение |
Цели и задачи |
Основные положения |
Способы машинного обучения |
Методы и алгоритмы машинного обучения |
Сравнение результатов |
Заключение |
Список литературы |
Курсовая работа|Информатика
Авторство: antiplagiatpro
Год: 2020 | Страниц: 15
Оглавление |
Введение |
Цели и задачи |
Основные положения |
Способы машинного обучения |
Методы и алгоритмы машинного обучения |
Сравнение результатов |
Заключение |
Список литературы |
Машинное обучение — обширный класс методов искусственного интеллекта, характерной чертой которых является не прямое решение поставленной задачи, а обучение в процессе применения решений множества схожих задач. Для создания алгоритмов машинного обучения используются средства численных методов, математической статистики, методов оптимизации, а также других математических наук.
Различают два типа обучения:
В данной области выделяют следующие типы задач.
Цели и задачи
Целью данной работы является изучение основных принципов и методов машинного обучения, а также рассмотрение различных подходов к решению задачи прогнозирования, а в частности прогнозирование результативности терапии для людей больных рассеянным склерозом.
Для достижения поставленной цели требуется выделить несколько важных задач:
Основные положения
Главная особенность машинного обучения в том , что решение находится не по четкой формуле, а по установленной зависимости результатов от конкретного набора признаков и их значений.Например, если каждый день в течении недели земля покрыта снегом и температура воздуха существенно ниже нуля, то вероятнее всего, наступила зима. Поэтому машинное обучение применяется для диагностики, прогнозирования, распознавания и принятия решений в различных прикладных сферах: от медицины до банковской деятельности.
Важная составляющая ML это оценка алгоритма, и здесь я хочу рассказать подробнее о метриках:
Перед переходом к самим метрикам необходимо ввести важную концепцию для описания этих метрик в терминах ошибок классификации — confusion matrix (матрица ошибок).
Допустим, что у нас есть два класса и алгоритм, предсказывающий принадлежность каждого объекта одному из классов, тогда матрица ошибок классификации будет выглядеть следующим образом:
Здесь y – истинная метка класса на объекте, а y^ - ответ алгоритма. Таким образом, ошибки классификации бывают двух видов: False Negative (FN) и False Positive (FP).
Интуитивно понятной, очевидной и почти неиспользуемой метрикой является accuracy — доля правильных ответов алгоритма:
Эта метрика бесполезна в задачах с неравными классами, и это легко показать на примере. Допустим, мы хотим оценить работу спам-фильтра почты. У нас есть 100 не-спам писем, 90 из которых наш классификатор определил верно (True Negative = 90, False Positive = 10), и 10 спам-писем, 5 из которых классификатор также определил верно (True Positive = 5, False Negative = 5).
Тогда accuracy = 86,4%
А если просто предсказывать все письма как не-спам, то доля правильных ответов увеличится, и составит 90.9%
При этом, наша модель совершенно не обладает никакой предсказательной силой, так как изначально мы хотели определять письма со спамом. Преодолеть это нам поможет переход с общей для всех классов метрики к отдельным показателям качества классов.
Для оценки качества работы алгоритма на каждом из классов по отдельности введем метрики precision (точность) и recall (полнота).
Precision можно определить как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, а recall показывает, какую долю объектов положительного класса из всех объектов положительного класса нашел алгоритм.
Precision и recall не зависят, в отличие от accuracy, от соотношения классов и потому применимы в условиях несбалансированных выборок.
На данном этапе, когда мы уже знаем какие примитивные оценки существуют можно перейти к способам машинного обучения.
Если данная работа вам не подошла, вы можете заказать помощь у наших
экспертов.
Оформите заказ и узнайте стоимость помощи по вашей работе в ближайшее время! Это бесплатно!
Оформите заказ, и эксперты начнут откликаться уже через 10 минут!