Skip to content

link75/ozon_parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Парсер интернет-магазина ozon.ru (тестовое задание)

Данный парсер собирает информацию о версиях операционных систем в топ-100 смартфонах с самым высоким рейтингом пользователей.

smartphones-os-and-version-distribution

После сбора данных можно выполнить расчет распределения моделей устройств по версиям операционных систем в порядке убывания.

Технологии

Установка

  1. Клонировать репозиторий
git clone <адрес_репозитория>
  1. Создать виртуальное окружение
python -m venv venv
  1. Активировать виртуальное окружение
source venv/Scripts/activate
  1. Обновить pip
python -m pip install --upgrade pip
  1. Установить зависимости из файла requirements.txt
pip install -r requirements.txt
  1. Заменить файл middlewares.py из виртуального окружения на обновленный с исправленными настройками web-драйвера из папки fixes/
путь-к-проекту\ozon_parser\venv\Lib\site-packages\scrapy_selenium
  1. Перейти в папку проекта (корневая директория)
cd ..
  1. Запустить паука для сбора ссылок на товары для категории
scrapy crawl product_links_spider
  1. Запустить паука для сбора данных по каждому товару
scrapy crawl product_data_spider
  1. Вывести в терминал данные (распределение моделей устройств по версиям операционных систем), запустить скрипт show_models.py
python show_models.py

Дополнительно

Парсер создан в рамках тестового задания с целью получения новых знаний и опыта. Возможны дальнейшие улучшения и доработки.

About

Парсер ozon.ru

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages