Данный парсер собирает информацию о версиях операционных систем в топ-100 смартфонах с самым высоким рейтингом пользователей.
После сбора данных можно выполнить расчет распределения моделей устройств по версиям операционных систем в порядке убывания.
- Клонировать репозиторий
git clone <адрес_репозитория>
- Создать виртуальное окружение
python -m venv venv
- Активировать виртуальное окружение
source venv/Scripts/activate
- Обновить pip
python -m pip install --upgrade pip
- Установить зависимости из файла requirements.txt
pip install -r requirements.txt
- Заменить файл
middlewares.pyиз виртуального окружения на обновленный с исправленными настройками web-драйвера из папкиfixes/
путь-к-проекту\ozon_parser\venv\Lib\site-packages\scrapy_selenium
- Перейти в папку проекта (корневая директория)
cd ..
- Запустить паука для сбора ссылок на товары для категории
scrapy crawl product_links_spider
- Запустить паука для сбора данных по каждому товару
scrapy crawl product_data_spider
- Вывести в терминал данные (распределение моделей устройств по версиям операционных систем), запустить скрипт
show_models.py
python show_models.py
Парсер создан в рамках тестового задания с целью получения новых знаний и опыта. Возможны дальнейшие улучшения и доработки.
