В репозитории представлены проекты, выполненные с использованием языка Python в среде Jupyter Notebook.
Отображение некоторых проектов на github ограничено - рекомендую смотреть через External Viewer.
Для удобства, ссылки сразу ведут на данный сервис просмотра. Если нужны исходные файлы - переходите в соответствующий раздел репозитория.
Каждый проект относится к решению определенной задачи, встречающейся в аналитике данных и машинном обучении.
№ | Название проекта | Описание | Тип | Инструменты |
---|---|---|---|---|
1 | Предсказывание коэффициента восстановления золота | На основе данных с параметрами добычи и очистки золота подготовлен прототип модели машинного обучения | промышленность |
Pandas Numpy Pandas_profiling Scipy Sklearn Pingouin Seaborn Matplotlib Missingo Plotly Catboost |
2 | Исследование нефтедобывающей компании | На основе предоставленых данных нефтедобывающей компании построена модель для предсказания места для бурения скважины | промышленность |
Pandas Numpy Pandas_profiling Scipy Sklearn Seaborn Matplotlib |
3 | Изучение рынка игр | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявлены закономерности, определяющие успешность игры | маркетинг |
Pandas Pandas_profiling Numpy Matplotlib Scipy Sklearn Plotly Seaborn Cufflinks Pingouin |
4 | Прогнозирование оттока клиентов | Используя исторические данные о поведении клиентов и расторжении договоров с банком, построена модель машинного обучения для прогнозирования оттока клиентов | банковский сектор |
Pandas Pandas_profiling Numpy Matplotlib Scipy Sklearn |
5 | Исследование надежности заемщиков | На основе статистики о платёжеспособности клиентов проведено исследование о влиянии семейного положения и количества детей клиента на факт возврата кредита в срок | банковский сектор |
Pandas Numpy PyMystem3 Sklearn Pandas_profiling Sweetviz Missingo |
6 | Рекомендация тарифов | Разработана система для анализа поведения клиентов и предложения пользователям нового тарифа для телеком компании | телеком |
Pandas Pandas_profiling Numpy Matplotlib Sklearn Sweetviz Catboost Seaborn |
7 | Определение выгодного тарифа для телеком-компании | На основе данных клиентов оператора сотовой связи проанализировано поведение клиентов и выявлен тариф приносящий максимальную прибыль | телеком маркетинг |
Pandas Numpy Pandas_profiling Pingouin Matplotlib Scipy Plotly |
8 | Исследование объявлений о продаже квартир | Используя данные сервиса Яндекс.Недвижимость, определена рыночная стоимость объектов недвижимости и типичные параметры квартир | недвижимость |
Pandas Numpy PyMystem3 Re Pandas_profiling Sklearn Seaborn Cufflinks Matplotlib |
9 | Определение стоимости автомобилей | Используя исторические данные, построена модель для определения стоимости автомобиля | авто |
Pandas Sklearn Catboost LightGBM Matplotlib Seaborn Pandas_profiling Missingo |
10 | Прогнозирование количества заказов такси | Используя исторические данные, построена модель для прогнозирования количества заказов такси на следующий час. | такси |
Pandas Sklearn LightGBM Xgboost Matplotlib Statsmodels |