Wget est un outil permettant d'aspirer des sites de manière non interactive, c'est à dire qu'il peut tourner en fond sans nécéssiter l'intervention d'un utilisateur une fois lancé. Outre cette fonction d'aspiration - rarement utile sur un serveur - cet outil permet surtout de récupérer des fichiers distants, que cela soit par http, https, ou ftp.
Dans le cadre d'une installation sur un serveur, wget est principalement utilisé pour deux taches : récupérer des fichiers à installer - ce qui est plus rapide que de le récupérer sur son ordi perso pour le renvoyer ensuite, même quand on a l'adsl - et pour les crons devant appeler un script php à heure précise, comme si un navigateur le consultait.
Comme bien souvent avec une debian, l'installation s'effectue facilement avec apt-get. Il vous faut donc vous logguer en root par la console (par ssh), et taper les commandes suivantes :
apt-get install wget
Reading Package Lists... Done
Building Dependency Tree... Done
The following NEW packages will be installed:
wget
0 packages upgraded, 1 newly installed, 0 to remove and 25 not upgraded.
Need to get 332kB of archives. After unpacking 1233kB will be used.
Get:1 http://security.debian.org stable/updates/main wget 1.8.1-6.1 [332kB]
Fetched 332kB in 0s (590kB/s)
Selecting previously deselected package wget.
(Reading database ... 17253 files and directories currently installed.)
Unpacking wget (from .../wget_1.8.1-6.1_i386.deb) ...
Setting up wget (1.8.1-6.1) ...
L'usage pour récupérer un fichier est tres simple :
wget http://www.sivit.fr
--23:35:42-- http://www.sivit.fr/
=> `index.html'
Résolution de www.sivit.fr... complété.
Connexion vers www.sivit.fr[81.91.65.141]:80...connecté.
requête HTTP transmise, en attente de la réponse...302 Found
Location: http://sivit.fr/fr/index.php?click= [suivant]
--23:35:43-- http://sivit.fr/fr/index.php?click=
=> `index.php?click='
Résolution de sivit.fr... complété.
Connexion vers sivit.fr[81.91.65.141]:80...connecté.
requête HTTP transmise, en attente de la réponse...200 OK
Longueur: non spécifié [text/html]
[ <=> ] 16,518 59.74K/s
23:35:43 (59.74 KB/s) - « index.php?click= » sauvegardé [16518]
L'option la plus utile est -O qui permet de spécifier dans quel fichier doit être sauvegarder l'url récupéree.
Pour les autres options, notamment l'aspiration - qui est en fait une récupération qui suit les urls trouvées dans les fichiers aspirés - vous pouvez faire un man wget ou un info wget.
Pour une utilisation en cron, il suffit simplement d'ajouter la commande wget http://www.domaine.com/url/du/script.php dans une tache cron (par webmin ou avec la commande crontab -e, voir les *futurs* tutoriaux à ce sujet).
Wget est un outil pratique, léger - un peu plus de 300k tout mouillé avec sa documentation - et facile à installer. Pourquoi s'en priver ?