Il arrive que vous puissiez avoir envie d’avoir accès à certaines informations sur un site web, sa structure, certains fichiers, etc. Une technique simple consiste à aspirer le site web.
Pour cela nous allons utiliser la commande wget
Je vous donne un exemple d’utilisation pour aspirer l’intégralité d’un site web:
wget -r -l5 -k -E www.unsite.com
Explications :
-r : récursif sur le site
-l5 : cinq niveaux de récursion au maximum
-k : convertir les destinations des liens pour une lecture locale
-E : convertir les types de fichier au format HTML (sans cette option les pages sont en PHP et donc sans LAMP pas possible de les lire)
Bien entendu beaucoup de fichiers ne sont pas téléchargeables, car protégés (ex: config.php, .htaccess, .htpasswd, etc)
Bulletins (RSS)