Un webcrawler basé sur Scrapy pour extraire les arrêtés de péril du site de la ville de Marseille
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
p 66724911fc
update readme pour windows
4 years ago
crawler rename 4 years ago
doc/img add image doc 4 years ago
.gitignore suprression fichiers locaux uploadés par erreur 4 years ago
LICENSE Initial commit 4 years ago
README.md update readme pour windows 4 years ago

README.md

Windows

Dépendances

Environnement virtuel et modules python

Environnement virtuel

Mise en place d'un environnement virtuel pour scrapy dans lequel seront installées les dépendances :

    python -m venv scrapy-env
    scrapy-env\Scripts\activate.bat

Modules

    python -m pip install --upgrade pip
    python -m pip install regex
    python -m pip install scrapy

Lancement de scrapy

    cd src
    scrapy crawl perils -O perils.csv