FRFAM.COM >> Famille >> Technologie &Innovation >> Informatique

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

De nombreux outils en ligne, extensions de navigateur ou logiciels de bureau permettent de transformer une page web en PDF. Cependant, pour convertir plusieurs liens simultanément, ces solutions manuelles deviennent chronophages et inefficaces.

Automatisez cette tâche avec Wget, un utilitaire en ligne de commande puissant et gratuit. Grâce à quelques scripts simples, découvrez comment sauvegarder et convertir plusieurs pages web en PDF de manière professionnelle.

Pourquoi choisir Wget ?

Wget est un logiciel open source pour télécharger des fichiers web. Il excelle aussi dans la mise en miroir de sites complets. Voici ses atouts principaux :

  • Non interactif : fonctionne en arrière-plan sans intervention constante.
  • Respecte la structure des répertoires et le fichier robots.txt, tout en suivant les liens HTML pour recréer un site local.
  • Résistant aux connexions instables : reprend les téléchargements interrompus.
  • Compatible avec les proxies pour un accès sécurisé et optimisé.

Installation de Wget

Sur macOS

Installez Wget via Homebrew, le gestionnaire de paquets incontournable pour macOS. Consultez notre guide d'installation Homebrew, puis exécutez :

brew install wget

Suivez la progression en temps réel. Si Homebrew est installé, mettez-le à jour avec brew upgrade pour la dernière version.

Sur Windows 10

Téléchargez la version 64 bits officielle depuis Eternally Bored. Placez l'exécutable dans C:\wget.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Ajoutez le chemin à la variable d'environnement : Panneau de configuration > Système > Paramètres système avancés > Variables d'environnement. Éditez Path, ajoutez C:\wget.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et WindowsGuide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Testez dans l'Invite de commandes avec wget -h ou dans PowerShell wget.exe -h.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Pour plusieurs liens, utilisez des extensions navigateur :

Link Clipper : Extrait tous les liens en CSV ou TXT. Sélectionnez une zone pour des liens ciblés. Fichier sauvé dans Téléchargements.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Snap Links Plus : Lasso les liens (bouton droit + Ctrl), copiez dans le presse-papiers.

Configurer un répertoire dédié

Wget recrée la structure web (images, CSS, JS). Créez un dossier pour organiser :

mkdir Wgetdown
cd Wgetdown

Détails des commandes Wget

Commande principale :

wget -E -H -k -K -p -i [chemin/vers/fichier.txt]

Options expliquées :

  • -E (--adjust-extension) : Ajoute .html si nécessaire.
  • -H (--span-hosts) : Autorise les ressources d'autres hôtes (ex. images CDN).
  • -p (--page-requisite) : Télécharge images, CSS, audio requis.
  • -k (--convert-links) : Adapte les liens pour consultation offline.
  • -K (--backup-converted) : Sauvegarde l'original avec .orig.
  • -i (--input-file) : Lit les URLs du fichier.

Mise en pratique

Exemple avec un manuel web (table des matières + chapitres).

Étape 1 : Créez le dossier via terminal.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Étape 2 : Exportez liens avec Link Clipper dans Téléchargements.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Étape 3 : Dans Wgetdown, exécutez (adaptez le chemin) :

wget -E -H -k -K -p -i ~/Downloads/links.txt
Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Étape 4 : Attendez la fin.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Étape 5 : Explorez le dossier généré.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Convertir HTML en PDF

Facteurs clés : polices, HTML valide, support tableaux/images, table des matières.

Windows 10

PrinceXML convertit HTML en PDF paginé, avec polices incluses. Gratuit pour usage personnel.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

macOS

Créez un service Automator : Nouveau > Action rapide > Recevoir fichiers/dossiers Finder. Ajoutez Run Shell Script (arguments) :

for f in "$@"; do
  cupsfilter "$f" > "${f%.*}.pdf"
 done

Enregistrez comme HTML2PDF. Sélectionnez HTML dans Finder > Clic droit > Services > HTML2PDF.

Guide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et WindowsGuide complet : Convertir plusieurs pages web en PDF avec Wget sur Mac et Windows

Convertir une seule page web en PDF

Ce processus semble complexe au début, mais gagne du temps à long terme sans abonnements payants.

Pour une page unique, consultez notre guide dédié.

[]