L'Internet regorge de connaissances précieuses, mais leur disponibilité n'est jamais garantie. Pour préserver le contenu que vous appréciez, utilisez un outil d'archivage web qui stocke une copie fidèle de la page.
Les services de lecture ultérieure populaires comme Instapaper ou Pocket excellent pour les articles textuels, mais peinent avec les mises en page complexes ou les médias riches. Vous souhaitez un contrôle total ?
Découvrez comment créer un clone auto-hébergé d'Instapaper ou Pocket sur votre machine, sans perte d'éléments web.
ArchiveBox est une solution open source puissante pour héberger votre propre alternative à la Wayback Machine. Protégez votre vie privée et gardez le contrôle total de vos archives.
Il transforme une liste d'URL en clones HTML locaux navigables, disponibles en formats multiples : HTML, captures d'écran, PDF et WARC (Web ARChive). Ces copies restent accessibles même si les originaux disparaissent.
Écrit en Python 3, ArchiveBox s'appuie sur des outils comme Wget, Chrome headless, youtube-dl et divers utilitaires Unix. Pas besoin de serveur permanent : exécutez-le à la demande pour importer des liens et générer des sorties statiques.
Une fois l'archivage terminé, ouvrez output/index.html dans votre navigateur pour explorer vos archives.

ArchiveBox supporte officiellement :
ArchiveBox requiert :
Deux méthodes : automatique (script) ou manuelle (recommandée pour debugging). Exemple sur macOS 10.14.6.
Utilisez Homebrew (voir guide d'installation).
Ouvrez le Terminal :
brew install python3 git wget curl youtube-dlbrew install --cask chromium(Ignorez si Chrome/Chromium déjà installé.)
Exécutez [outil] --version pour python3, wget, etc.

Exportez depuis navigateurs/services en HTML, ou listez URL dans un fichier texte. Voir guide.
Clonez le dépôt :
git clone https://github.com/ArchiveBox/ArchiveBox.gitcd ArchiveBoxLe dossier ~/ArchiveBox contient fichiers et configs.

Pour un lien unique :
echo 'https://example.com' | ./bin/archivebox add
Voyez le nouveau dossier dans output, avec index.html.

Pour listes (fichier texte) :
./bin/archivebox add /path/to/links.txtEx. : ./bin/archivebox add ~/Downloads/links.txt
Patienter ; ouvrez output/index.html pour tri, recherche.

Cliquez favicon sous "Fichiers" pour détails (HTML, PDF, etc.). Lien vers archive.org aussi.

Pour Instapaper/Pocket : ./bin/archivebox add ~/Downloads/export.html
Pour flux RSS : divisez gros volumes pour succès maximal.
Paramètres par défaut OK, mais personnalisez via :
cp ./ArchiveBox/ArchiveBox.conf ~/.ArchiveBox.confÉditez ~/.ArchiveBox.conf (Cmd+Maj+. pour voir fichiers cachés).

Voir docs officielles pour plus.
Hébergez statiquement (GitHub Pages, serveur local/VPS). Attention : risques sécurité avec assets tiers ; utilisez robots.txt pour privé.
ArchiveBox complète outils d'archivage web. Alternative idéale à Instapaper/Pocket. Pour sites complets, voir tutoriel dédié.