FRFAM.COM >> Famille >> Technologie &Innovation >> Informatique

Comment rechercher sur Amazon des millions de documents publics, d'images et plus encore

Amazon Web Services (AWS) est la baleine bleue du cloud computing. Vous ne vous en rendez peut-être pas compte, mais la plupart des sites Web et des services Web fonctionnent sur cette plate-forme. Et en fait, le cloud public d'AWS est plus grand que Microsoft, Google et IBM réunis.

Comme toute autre plate-forme cloud massive, AWS héberge une variété de données accessibles au public. Par exemple, vous pouvez trouver d'énormes ensembles de données de 100 millions d'images et de vidéos Creative Commons sur Flickr. Accédez-y à l'aide du navigateur YFCC100m.

Essayez une recherche avec Google. Vous serez surpris par la quantité massive de documents publics que vous pouvez trouver sur AWS. L'un des moyens les plus rapides de rechercher des fichiers PDF dans AWS consiste à utiliser le bon vieux Google et l'un de ses opérateurs de recherche avancée.

[Mot-clé] type de fichier :PDF site :amazonaws.com 

Bien sûr, les fichiers sont ouverts au public et peuvent être disponibles sur les portails de recherche des sites qui les hébergent sur AWS. Mais cette approche par mots clés est une "recherche expérimentale" qui vous aide à fouiller dans l'énorme botte de foin en une seule fois au lieu d'aller sur chaque site.

Vous pouvez également utiliser la page de recherche avancée de Google pour créer votre requête plus précisément, puis l'exécuter pour effectuer une recherche dans le cloud d'Amazon. Je préfère un petit outil de recherche appelé Advangle, qui vous aide à créer des requêtes de recherche de manière visuelle.

Un lieu "invisible" pour la recherche Web

Un moteur de recherche est une porte d'entrée sur le Web. Mais il existe de nombreuses façons de rechercher des données approfondies et d'améliorer vos compétences en recherche. Bien sûr, n'utilisez pas les informations (en particulier les images) à l'aveuglette. Trouvez le site qui détient les informations et vérifiez leurs restrictions de copyright.

Je pense que les opérateurs de recherche avancés de Google devraient faire partie de nos habitudes de recherche. Qu'est-ce que tu penses? Mentionnez quelques répertoires ouverts où vous aimez faire vos recherches en ligne.


[]