Skip to content

TevenixLevelUps/ML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 

Repository files navigation

ML

Guideline for git

  1. Форкаем данный репозиторий (В github)
  2. Клонируем данный репозиторий на ваш ПК (git clone https://github.com/TevenixLevelUps/ML)
  3. Жестко чет пишем
  4. Добавляем изменения в staging (git add .)
  5. Фиксируем прибыль (изменения) (git commit -m "Some title for commit.")
  6. Отправляем изменения в удаленный репозиторий (git push -u https://github.com/TevenixLevelUps/ML)
  7. Создаем PR в вашем удаленном github репозитории. Укажите ФИО и ссылку на ТГ. Будут вопросы - обращайтесь в группу левелапов дабы избежать повторяющихся вопросов. Стесняетесь - @ffandorin

Task 1

Реализовать алгоритмы градинетного спуска (полный, стохастический, батчевый), протестировать их на нескольких моделях регрессии и сравнить результаты.

В качестве данных для обучения используйте какой-нибдуь небольшой датасет, типа California House Pricing или load_iris. Не забудьте разделить его данные на тренировочные и тестовые.

Поэксперементируйте с настройками. Протестируйте алгоритмы с различными значениями гиперпараметра (величины шага спуска), количествами итераций или критериями остановки, величинами батча.

Продемонстрируйте результаты работы с алгоритмами, например, путем оценки моделей с помощью метрик, построением графиков зависимости значеня функции потерь от количества итераций или количества итераций алгоритма перед срабатыванием критерия остановки и т.д.

Task 2

Все просто: реализовываем модель бинарной логистической регрессии.

Берем удобный вам набор данных с дискретной величиной, которую хотите предсказывать. Прописываем модель, обучаем ее с помощью LogLoss и любого удобного численного метод (можно градиентный спуск). Тестируем модель на тестовых данных. Из обязательных метрик: Precision, Recall, ROC-кривая и ROC-AUC (метрики реализовывать тоже самому).

Можете проверить на ней L1 и L2 регуляризацию.

Task 3

Реалзизовать свою модель случайного леса.

Задать модель решающего дерева, написать алгоритм CART для его обучения (для задачи регрессии или классификации, на выбор).

Задать ансамбль деревьев, с помощью бутстрапа дать каждому дереву свою обучающую подвыборку и подпространство признаков, обучить ансамль и агрегировать ответы всех деревьев.

Протестировать ансамбль на каком-нибудь наборе данных, сравнить его производительность с одним решающим деревом.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors