Идея проекта заключается в выявлении корреляции между параметрами мужских футболок поло бренда Lacoste и их ценами.
Первично написан парсер на python, который собирает данные с динамических страниц веб сайта lacoste.ru. Код парсера находится в файле scrapper.py
Далее собранная информация будет первично обработана и анализирована для выявления корреляций, аномалий и прочего
Последний этап, при подтверждении гипотезы о наличии значимого влияния факторов на цену - построение модели машинного обучения, способную прогнозировать доверительный интервал цены футболки по заданным параметрам
Инструкция по установке и запуску некоторых файлов с репозитория на локальный компьютер
For mac or unix based systems only
- Open terminal
- Go to the directory you want to repo copied in
- Clone repo by entering
git clone [email protected]:anr65/main
- Now enter
python scrapper.py
which will run the scrapper code - Wait until scrapper finishes parsing the data and it'll create two files in the current diretory
- data_lac.csv is the raw scrapped data, data_ready.csv is the ready to analyze data which next is going to be enhanced