Skip to content
View egorumaev's full-sized avatar
  • Omsk
  • 19:28 - 12h behind

Block or report egorumaev

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
egorumaev/README.md

Привет) 👋

РЕЗЮМЕ


ПРОФЕССИОНАЛЬНАЯ ПЕРЕПОДГОТОВКА


КУРСЫ


"Курсы, пройденные на портале STEPIK"


НАВЫКИ

Python 3 SQL MS Excel Power Query Power Pivot
VBA MS Power BI Pandas Numpy Jupiter Notebook
classical ML Matplotlib Seaborn DataLens Scikit-learn
Catboost LightGBM XGBoost А/В-тесты pgAdmin
DBeaver Redash SciPy Linux Astra Linux
Bash Docker RegEx Git

ВЫПОЛНЕННЫЕ ПРОЕКТЫ

Название Цель Библиотеки Технологии
1 «Расчет среднего времени ответа менеджеров службы поддержки» рассчитать среднее время ответа для каждого менеджера службы поддержки на запросы клиентов Psycopg2, Pandas SQL (PostgresSQL), оконные функции, CTE (Common Table Expressions), LaTex
2 «Создание Docker-образа на основе актуальной версии Docker-образа Ubuntu и собственного Dockerfile с загрузкой в репозиторий на Docker Hub» создать собственный Docker-образ с последующей загрузкой в облачный репозиторий на Docker Hub Linux (Astra Linux, Ubuntu), Bash, Vim, Docker, Docker Image, Dockerfile, Docker Hub
3 «Настройка сервера SSH для многопользовательского доступа» настроить сервер SSH для многопользовательского доступа в локальной компьютерной сети Linux (Astra Linux), Bash, Vim, SSH, SSH-сервер, SSH-клиент, NAT Network, Inrental Network
4 «Настройка NFS и Samba в компьютерной сети» реализовать настройку NFS и Samba в компьютерной сети Linux (Astra Linux), Bash, Vim, SSH, SOCKS, SQUID, NFS, Samba
5 «Сбор информации об операционной системе удаленного сервера» с помощью протокола SSH подключиться к удаленному серверу и собрать информацию об операционной системе Linux (Astra Linux), Bash, SSH, SCP
6 «Оценка результатов эксперимента на этапе планирования A/B-теста» на этапе планирования A/B-теста провести анализ соответствия плановых значений метрик теста и расчитанного размера выборки Pandas, Numpy, Matplotlib, Statsmodels, Tqdm Monte Carlo Method, A/B Test Calculator by Gleb Mikhaylov, Evan Miller Sample Size Calculator, LaTeX
7 «Сравнение точности двух тестов с бинарным ответом на примере тестов на беременность на основе анализа значений sensitivity и specificity тестов» на основе анализа метрик двух тестов определить, какой из тестов является более точным Pandas, Matplotlib, Sklearn Monte Carlo Method, LaTeX
8 «SQLite & PostgreSQL. Анализ данных в Google Colab» провести анализ данных с помощью SQLite и PostgreSQL в Google Colab Sqlite3, SQLAlchemy, Pandas, Missingno, Matplotlib SQLite, PostgreSQL, ElephantSQL, оконные функции, Google Colab, Google Drive
9 «Турникеты» (Open Data Science) на основе накопленных данных идентифицировать посетителя в зависимости от характерного времени его прохода на территорию организации, исключив вероятность передачи пропуска одним сотрудником другому (задача мультиклассификации) Pandas, Numpy, Random, Matplotlib, Seaborn, Datetime, Sklearn, Imblearn, CatBoost Feature Engineering, Polynomial Features, SelektKBest, GridSearchCV, RandomizedSearchCV, Pipeline, OneVsRestClassifier, confusion_matrix
10 «Прогнозирование исхода лечения цирроза печени – Prediction of Cirrhosis Outcomes» (Kaggle) предсказание вероятности исхода лечения пациентов с циррозом печени (задача мультиклассификации) Pandas, Numpy, Matplotlib, Seaborn, Missingno, Dataprep, Phik, Category_encoders, Sklearn, Imblearn, Catboost, XGBoost IQR (Interquartile Range), PCA (Principal component analysis), LDA (Linear Discriminant Analysis), t-SNE (T-distributed Stochastic Neighbor Embedding), Feature Engineering, Polynomial Features, Pipeline, VarianceThreshold, SMOTETomek
11 «Разработка модели машинного обучения для предсказания температуры стали для оптимизации производственных расходов металлургического комбината „Так закаляем сталь‟» (Яндекс.Практикум) разработка модели машинного обучения, предсказывающей температуру стали, выплавляемой на металлургическом комбинате «Так закаляем сталь» (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, DateTime, Phik, Sklearn, Imblearn, Feature_Engine, Catboost, Xgboost, Lightgbm Pipeline, Feature Engineering, RandomizedSearchCV, PolynomialFeatures, MinMaxScaler, DropCorrelatedFeatures, SelektKBest, VotingRegressor, background_gradient
12 «Разработка модели машинного обучения для прогнозирования оттока клиентов оператора связи „Ниединогоразрыва.ком‟» (Яндекс.Практикум) разработка модели машинного обучения, прогнозирующей возможный отток клиентов (задача классификации) Pandas, Numpy, Matplotlib, Seaborn, Skimpy, Datetime, ydata-profiling, Psutil, Phik, Sklearn, Imblearn, Catboost, Xgboost, LightGBM Pipeline, Feature Engineering, RandomizedSearchCV, MinMaxScaler, mutual_info_regression, Mutual Information, OneHotEncoder, OrdinalEncoder, MinMaxScaler, SelectKBest, chi2, VotingClassifier, confusion_matrix, background_gradient
13 «Определение возраста покупателей» (Яндекс.Практикум) построение модели, которая по фотографии определит приблизительный возраст человека (задача регрессии для Computer Vision) Pandas, Numpy, Matplotlib, Seaborn, PIL, Tensorflow, Keras Yandex Compute Cloud
14 «Выявление токсичных комментариев в отзывах покупателей интернет-магазина „Викишоп‟» (Яндекс.Практикум) построение модели классификации комментариев пользователей на позитивные и негативные (задача классификации для Natural Language Processing / NLP) Pandas, Numpy, Matplotlib, Seaborn, Autocorrect, Contractions, Gc, Collections, Re, NLTK, Sklearn, Catboost Pipeline, RandomizedSearchCV, TfidfVectorizer, CountVectorizer, ngram_range
15 Задача «Классификация тональности текста» (Яндекс.Практикум) обучение логистической регрессии для определения тональности текста (задача классификации для Natural Language Processing / NLP) Pandas, NLTK, Sklearn Google Drive
16 «Прогнозирование количества заказов такси на следующий час для компании „Чётенькое такси‟» (Яндекс.Практикум) построение модели, предсказывающей количество заказов такси на следующий час (задача регрессии для Time Series) Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn, Catboost, LightGBM seasonal_decompose, TimeSeriesSplit, RandomizedSearchCV
17 «Определение рыночной стоимости автомобилей» (Яндекс.Практикум) разработка модели машинного обучения, предсказывающей рыночную стоимость автомобиля (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Joypy, Skimpy, Datetime, Sklearn, Feature-engine, Catboost, LightGBM KNNImputer, SimpleImputer, OneHotEncoder, OrdinalEncoder, MinMaxScaler, DropCorrelatedFeatures, SelectKBest, mutual_info_regression, make_scorer, RandomizedSearchCV
18 «Защита персональных данных клиентов страховой компании „Хоть потоп‟» (Яндекс.Практикум) разработка метода преобразования данных, гарантирующего одновременно невозможность восстановления персональной информации и высокое качество моделей машинного обучения, использующих обезличенные персональные данные Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn
19 «Разработка модели, предсказывающей коэффициент восстановления золота из золотодобывающей руды для группы компаний „Цифра‟» (Яндекс.Практикум) подготовка прототипа модели машинного обучения, предсказывающей коэффициент восстановления золота из золотосодержащей руды (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Torchmetrics, Joypy, Sklearn Symmetric Mean Absolute Percentage Error, make_scorer, RandomizedSearchCV
20 «Поиск локации для скважины для ПАО „ГлавРосГосНефть‟» (Яндекс.Практикум) определение региона, где добыча нефти принесёт наибольшую прибыль (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn Анализ возможной прибыли и рисков с помощью техники Bootstrap
21 «Предсказание оттока клиентов из банка» (Яндекс.Практикум) построение модели машинного обучения, предсказывающей отток клиентов из банка (задача классификации) Pandas, Numpy, Random, Matplotlib, Seaborn, Skimpy, Imbalanced-learn, Phik, Collections, Tqdm, Sklearn SMOTE, ADASYN, RandomUnderSampling, SMOTETomek, OneHotEncoder, OrdinalEncoder, StandardScaler, mutual_info_regression, SelectKBest, GridSearchCV
22 «Рекомендация тарифов» (Яндекс.Практикум) на основе данных о поведении клиентов оператора мобильной связи 'Мегалайн', уже перешедших на новые тарифы 'Smart' и 'Ultra', построить модель для классификации пользователей в зависимости от используемого ими тарифа (задача классификации) Pandas, Numpy, Matplotlib, Seaborn, Tqdm, Sklearn GridSearchCV
23 «Интернет-магазин „Стримчик‟» (Яндекс.Практикум) на основе исследования информации из открытых источников выявить факторы и закономерности, определяющие успех выпуска компьютерной игры при планировании вывода на рынок новой компьютерной игры и оптимизации бюджета рекламной компании Pandas, Numpy, Random, Matplotlib, Seaborn, Scipy
24 «Исследование объявлений о продаже квартир в Санкт-Петербурге и Ленинградской области» (Яндекс.Практикум) проведение исследовательского анализа данных датасета с объявлениями о продаже квартир Pandas, Numpy, Random, Matplotlib, Seaborn

Popular repositories Loading

  1. yandex-training-algorithms-1-0 yandex-training-algorithms-1-0 Public

    Тренировки по алгоритмам 1.0

    Jupyter Notebook 1

  2. 2024-colab-sqlite-postgresql 2024-colab-sqlite-postgresql Public

    SQL-запросы в Google Colab с помощью SQLite и PostgreSQL

    Jupyter Notebook 1

  3. 2022-realty-spb 2022-realty-spb Public

    Исследование объявлений о продаже недвижимости

    Jupyter Notebook

  4. 2022-computer-games-sales 2022-computer-games-sales Public

    Анализ мирового рынка продаж компьютерных игр

    Jupyter Notebook

  5. 2022-telekom-tarif-recomendation 2022-telekom-tarif-recomendation Public

    Классификация пользователей в зависимости от используемого тарифа телеком-оператора

    Jupyter Notebook

  6. 2022-bank-customers-churn 2022-bank-customers-churn Public

    Предсказание оттока клиентов из банка

    Jupyter Notebook