Un webcrawler basé sur Scrapy pour extraire les arrêtés de péril du site de la ville de Marseille
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
p faf9dc4549
doc : ajout carte jpg
3 years ago
crawler rename 3 years ago
doc/img doc : ajout carte jpg 3 years ago
.gitignore suprression fichiers locaux uploadés par erreur 3 years ago
LICENSE Initial commit 3 years ago
README.md update readme 3 years ago

README.md

Environnement virtuel pour python

python3 -m venv scrapy-env

(unix-like) source scrapy-env/bin/activate

(windows) tutorial-env\Scripts\activate.bat

Installation des dépendances

python -m pip install --upgrade pip

python -m pip install regex

python -m pip install scrapy

Lancement de scrapy

cd src

scrapy crawl perils -O perils.csv