Un webcrawler basé sur Scrapy pour extraire les arrêtés de péril du site de la ville de Marseille
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
usretc 2933c37c4b
suprression fichiers locaux uploadés par erreur
3 years ago
src Commit initial 3 years ago
.gitignore suprression fichiers locaux uploadés par erreur 3 years ago
LICENSE Initial commit 3 years ago
README.md update readme 3 years ago
perils-table.ods Commit initial 3 years ago

README.md

Environnement virtuel pour python

python3 -m venv scrapy-env

(unix-like) source scrapy-env/bin/activate

(windows) tutorial-env\Scripts\activate.bat

Installation des dépendances

python -m pip install --upgrade pip

python -m pip install regex

python -m pip install scrapy

Lancement de scrapy

cd src

scrapy crawl perils -O perils.csv