(ссылка на проект https://colab.research.google.com/drive/1NDi6Vr-GJehaRQvsjuZMIZbIHEDqgP2L?usp=sharing
- Описание проекта
- Основная проблема проекта?
- Краткая информация о данных
- Этапы работы над проектом
- Результат
- Выводы
Из базы данных, содержащей информацию о вакансиях сайта hh.ru, необходимо проанализировать первичные данные для построения модели, которая будет рекомендовать вакансии клиентам агентства, претендующим на позицию Data Scientist.
Нужно изучить имеющиеся данные с точки зрения их соответствия поставленным задачам. Для этого создаем запросы к базе данных и определить направления дальнейшего исследования. Это позволит построить модель, которая будет рекомендовать вакансии клиентам агентства, претендующим на позицию Data Scientist.
Условия выполнения проекта: Каждая из частей проекта состоит из блока практических заданий, которые выполнены в своих Jupyter-ноутбуках, и контрольных вопросов на платформе, которые проверяются автоматически.
Оценка результатов: Результаты оцениваются согласно требованиям, указанным к проекту. Необходимо: ответить на контрольные вопросы (максимум 23 балла), сдать проект на проверку, загрузив ноутбук-шаблон со своим решением на GitHub (максимум 8 баллов
Чему учимся: Составлять запросы SQL, писать код на Python для анализа исходных данных, представлять проект на GitHub
В проекте данные представлены в виде взаимосвязанных таблиц, находящихся в схеме public базы данных project_sql: VACANCIES(таблица с данными по вакансиям), AREAS(таблица-справочник, которая хранит код города и его название), EMPLOYERS(таблица-справочник со списком работодателей), INDUSTRIES(таблица-справочник вариантов сфер деятельности работодателей), EMPLOYERS_INDUSTRIES(дополнительная таблица для организации связи между работодателями и сферами их деятельности).
- Знакомство с данными;
- Предварительный анализ данных;
- Детальный анализ вакансий;
- Анализ работодателей;
- Предметный анализ.
- Проверка соответствия написанного кода стандарту PEP8
- Оформление проекта
- Загрузка проекта на GitHub
Проект c "Анализ резюме из HeadHunter " представлен в репозитории на GitHub
В процессе выполнения проекта первоначальные данные были проанализированы, преобразованы, проведен детальный анализ данных (с визуализацией результатов некоторых запросов) с целью выявления взаимосвязей между признаками.