Retour au blog
Les techniques de web scraping
Robert MunceanuLast updated on Apr 10, 202610 min read

Les 7 meilleures listes de proxys gratuits pour le web scraping

Les 7 meilleures listes de proxys gratuits pour le web scraping

En matière de web scraping, soit vous utilisez des proxys, soit vous ne parvenez pas à extraire correctement les données. Certes, vous n’avez peut-être pas besoin d’un proxy backconnect disposant de milliers d’adresses IP de centres de données et résidentielles, mais vous aurez tout de même besoin de quelques proxys de base.

Le gros problème pour les scrapers amateurs ou débutants, c'est que les adresses IP coûtent généralement de l'argent. Heureusement, il existe des proxys gratuits. En fait, il y a pas mal d'options parmi lesquelles choisir. Nous en avons exploré certaines et avons sélectionné les 7 meilleures pour que vous n'ayez que le meilleur, du moins en ce qui concerne les proxys gratuits.

Avant de passer à la liste, nous devrions toutefois aborder quelques détails. Les proxys gratuits sont formidables car ils ne nécessitent aucun investissement, mais ils ne sont pas parfaits.

Les avantages et les inconvénients des proxys gratuits

Tout d'abord, ils sont gratuits. C'est un peu évident, mais c'est un avantage considérable. Imaginez : vous pouvez suivre n'importe lequel des guides de notre blog, coder votre scraper, puis l'utiliser avec les proxys.

Il y a beaucoup à dire sur les avantages des proxys dans le web scraping, et nous n'allons pas les passer en revue dans cet article. Mais si vous souhaitez en savoir plus, consultez cet article sur les proxys rotatifs, dans lequel nous expliquons à quel point un pool d'adresses IP peut faire la différence.

Malheureusement, c'est à peu près le seul avantage des proxys gratuits par rapport aux autres. Passons maintenant aux inconvénients.

Comme ces adresses IP sont librement accessibles, tout le monde les connaît. Les sites web connaissent donc probablement déjà ces adresses et les ont déjà bloquées. Soit quelqu’un a déjà essayé d’accéder au site web qui vous intéresse et s’est fait bannir l’adresse IP, soit le webmaster a trouvé le fournisseur de proxys gratuits, a copié toutes les adresses IP et les a ajoutées à une liste noire. Ce n’est pas toujours le cas, mais cela arrive souvent.

Les adresses IP gratuites sont souvent lentes et manquent d'anonymat. La maintenance des proxys coûte de l'argent, vous ne pouvez donc pas sérieusement vous attendre à obtenir des adresses IP de qualité supérieure sans rien débourser. Comme le dit le proverbe, on en a pour son argent.

Les proxys gratuits peuvent vous exposer aux pirates informatiques. Comme je viens de le dire, il est un peu inhabituel que quelqu’un offre des adresses gratuitement. Une raison malveillante pour laquelle quelqu’un pourrait faire cela est de surveiller et de copier les informations qui transitent par le proxy. Par la suite, cette personne pourrait utiliser ces informations à des fins malveillantes. Encore une fois, ce n’est pas une certitude, mais vous devez rester sur vos gardes.

1. WebScrapingAPI

Le principal facteur qui distingue WebScrapingAPI des autres fournisseurs de cette liste est que l'API utilise uniquement des proxys premium. Cela inclut à la fois des adresses IP résidentielles et de centres de données, avec de nombreuses options de géolocalisation (7 pour les centres de données, 40 pour les adresses résidentielles et plus de 200 pour les forfaits personnalisés). Bien qu'il existe des forfaits payants, allant de 20 $ à 200 $, tout nouvel utilisateur bénéficie d'une période d'essai gratuite de deux semaines, durant laquelle il peut utiliser toutes les fonctionnalités de l'API.

La rotation des proxys est gérée automatiquement par l'API ; ainsi, sauf demande contraire de votre part, toutes les requêtes passeront par des adresses IP différentes. De plus, vous pouvez envoyer jusqu'à 10 requêtes simultanées, ce qui signifie que vous pouvez exploiter pleinement le pool de proxys pour extraire des données à une vitesse fulgurante.

Bien entendu, WebScrapingAPI ne propose pas seulement des proxys, mais aussi l'accès au scraper. Vous bénéficiez ainsi de toutes les fonctionnalités d'un outil d'extraction de données haut de gamme sans avoir à écrire une seule ligne de code.

Une fois la période d'essai gratuite terminée, vous n'aurez toujours pas à dépenser un centime, sauf si vous le souhaitez, car vous passerez au forfait gratuit, avec 1 000 appels API par mois, aussi longtemps que vous le souhaitez.

2. ProxyScan

ProxyScan est un ensemble d'outils utiles regroupés sur un seul site web. Le plus important est la liste de proxys. Ils affirment disposer de plus de 12 000 proxys au total. Bien que ce chiffre soit impressionnant, d'après ce que j'ai pu constater, le nombre pourrait être un peu inférieur, peut-être parce que les proxys gratuits apparaissent et disparaissent constamment, ce qui fait que le nombre peut varier.

Parmi ces proxys, presque tous sont de type SOCKS 4 ou 5, un peu plus de 100 étant de type HTTP/S. De plus, presque tous sont anonymes ou « elite », qui sont les seuls qui comptent vraiment pour le web scraping.

En matière de géolocalisation, ProxyScan propose des adresses IP provenant de plus de 100 pays. Même si tous ces pays ne disposent pas d’un grand nombre de proxys, la couverture reste bonne. Vous pouvez également vérifier la disponibilité et le ping de chaque adresse IP, ce qui facilite le choix des meilleures adresses.

3. Proxy-List

L'idée générale derrière Proxy-List semble être la quantité plutôt que la qualité. Au total, ils disposent de plus de 17 000 proxys, dont la plupart sont de type SOCKS 4. Je dis qu'ils accordent moins d'importance à la qualité car vous n'obtenez aucune information sur le temps de disponibilité ou le ping des adresses IP. Le site web met à jour ses listes toutes les deux heures et élimine les adresses IP qui ne répondent pas.

En consultant leurs listes, vous obtenez l'adresse IP, le port, le niveau d'anonymat et le pays. Comparé aux autres fournisseurs de cette liste, cela laisse quelque peu à désirer.

Vous pouvez filtrer les résultats par niveau d'anonymat (transparent, anonyme ou élite) et par pays. J'ai remarqué que certains des pays que vous pouvez sélectionner dans le filtre ne disposent en réalité d'aucun proxy sur le site web. Ne vous attendez donc pas nécessairement à trouver des adresses IP de toutes les régions. Cela dit, il reste tout de même de nombreuses options.

En plus de parcourir leurs nombreuses pages, vous pouvez également télécharger des listes au format texte brut ou directement dans le presse-papiers. Bien que le processus soit beaucoup plus rapide ainsi, le fichier txt ne contient que les adresses IP ; si vous souhaitez également enregistrer les ports ou les pays d'origine, vous devrez les récupérer directement sur le site. Comme on peut s'y attendre, je vous suggère de scraper les pages plutôt que de récupérer les données manuellement.

4. Free Proxy

Même si Free Proxy n'est peut-être pas le site web le plus esthétique, il dispose d'un grand nombre d'adresses IP, de leurs détails et de toutes les fonctionnalités de filtrage dont vous aurez besoin.

Le nombre total d'adresses IP dépasse les 23 000, dont la plupart sont de type SOCKS4/5. Ces adresses IP proviennent de 160 pays au total. La plupart des adresses IP sont situées en Asie, mais vous n'aurez aucun mal à trouver des proxys provenant des quatre coins du monde.

Si vous consultez leurs listes, vous y trouverez une mine d’informations, notamment la vitesse, la disponibilité, le temps de réponse et le temps écoulé depuis la dernière vérification. Ce dernier détail est en réalité l’un des points faibles de ce fournisseur : de nombreuses adresses IP sont vérifiées assez rarement, et il y a de fortes chances de tomber sur de nombreuses adresses IP inactives, surtout si plusieurs jours se sont écoulés depuis leur dernier ping.

Pour naviguer, vous pouvez filtrer par pays, anonymat et protocole. Vous pouvez ensuite trier la liste obtenue par vitesse, disponibilité, temps de réponse et « dernière vérification ». Vous ne devriez donc pas mettre longtemps à trouver ce que vous cherchez. De plus, un bouton intitulé « Exporter IP:Port » vous permet de copier rapidement l'adresse complète afin de l'ajouter à votre scraper.

5. Spys.one

Tout comme le fournisseur précédent, Spys.one propose un large éventail d’adresses IP provenant du monde entier. Au total, ils semblent disposer de plus de 26 000 proxys, ce qui les place devant Free Proxy. Cependant, de nombreuses adresses IP n’ont pas été vérifiées depuis des semaines, voire des mois, et risquent donc de ne plus fonctionner.

En termes de navigation, vous pouvez choisir pratiquement n’importe quel critère pour filtrer la liste. Vous pouvez même sélectionner par ville, même si de nombreux proxys n’ont en réalité pas de ville spécifiée. N’utilisez donc cette option que si elle est indispensable pour votre cas d’utilisation. Sinon, vous risqueriez de passer à côté de possibilités intéressantes.

Même si le fournisseur semble disposer d'un grand nombre d'adresses IP, je ne suis pas très fan de l'interface utilisateur, et obtenir toutes ces adresses IP pourrait s'avérer plus compliqué que prévu.

6. Genode

Contrairement à la plupart des autres sites de cette liste, Genode ne tire pas ses revenus de la publicité, mais de la location de proxys résidentiels premium. Mais en plus de cela, ils proposent également une liste de proxys gratuits accessible à tous les visiteurs.

Cette liste contient près de 5 000 proxys répartis dans un nombre impressionnant de pays. Pour parcourir cette liste, vous pouvez choisir le pays, le niveau d'anonymat, le protocole de proxy, l'organisation, la vitesse, le temps de disponibilité et la date de la dernière vérification. En substance, vous filtrez selon tous les critères de différenciation qu'ils proposent.

Lorsque vous vérifiez la vitesse, vous obtenez un temps réel (en millisecondes) et une barre qui compare la vitesse de cette adresse IP particulière à celle des autres dans la liste. De plus, si le temps de réponse est anormalement long, le chiffre s'affiche en rouge, ce qui signifie qu'il est probablement trop lent pour une utilisation correcte.

Ce genre de petits détails peut avoir un impact sur vos résultats globaux, c'est pourquoi Genode mérite une place dans la liste, même si le pool de proxys est un peu plus restreint que celui des autres sites que j'ai présentés.

7. Free Proxy Lists

Même si je ne peux pas qualifier Free Proxy Lists de site web le plus esthétique, il va droit au but en vous présentant une liste exhaustive d’adresses IP.

Il est louable que la plateforme dispose de proxys provenant de 78 pays différents, un nombre que vous n'obtiendriez peut-être pas auprès de fournisseurs de services payants. Malheureusement, bon nombre de ces pays comptent moins de 10 adresses IP chacun. Dans de nombreux cas, il n'y a qu'un seul proxy par région.

Au total, ils disposent de plus de 600 adresses IP, qui utilisent toutes le protocole HTTP ou HTTPS ; vous n'aurez donc aucune chance si vous avez besoin de SOCKS.

Passer d'une page à l'autre à la recherche du bon proxy peut vite devenir fastidieux, mais le site web vous permet de filtrer les résultats par pays, port, protocole, anonymat et disponibilité. Vous pouvez également voir leurs vitesses de réponse et de transfert représentées par des barres de chargement colorées. Bien qu'elles ne soient pas très explicites, elles peuvent vous aider à choisir les adresses IP les plus rapides.

Choisissez vos proxys avec soin

Bien que je comprenne l'attrait des proxys gratuits et que je vous recommande au moins de les essayer, n'oubliez pas que votre temps est également une ressource. En fait, il peut être plus précieux que l'argent.

Je m'explique : passer en revue des milliers de proxys gratuits peut réduire les coûts puisque vous n'achetez pas de proxys premium, mais cela exigera une attention constante de votre part. L'adresse IP cessera souvent de fonctionner ou sera bloquée, et vous devrez alors trouver une nouvelle liste et l'ajouter à votre script. À mesure que de nouvelles adresses IP gratuites apparaissent, vous devrez les ajouter, car les anciennes finiront tôt ou tard par ne plus fonctionner.

En substance, les proxys gratuits permettent d’économiser de l’argent mais nécessitent un travail répétitif. Je recommanderais à tout passionné de scraping de créer au moins un scraper et de l’utiliser avec des proxys gratuits, car c’est une excellente expérience d’apprentissage. Après cela, cependant, vous souhaiterez peut-être simplement obtenir des données précises livrées à temps, avec peu ou pas d’intervention humaine.

C'est la philosophie qui sous-tend WebScrapingAPI. Nous avons développé une API REST pour effectuer la majeure partie du travail à votre place, afin que vous puissiez vous concentrer sur l'exploitation optimale de vos données. Si ce n'est pas déjà fait, commencez votre essai gratuit de WebScrapingAPI pour découvrir un scraper de premier ordre avec des proxys ultra-fiables !

À propos de l'auteur
Robert Munceanu, Développeur full-stack @ WebScrapingAPI
Robert MunceanuDéveloppeur full-stack

Robert Munceanu est développeur Full Stack chez WebScrapingAPI ; il participe à l'ensemble du produit et contribue à la création d'outils et de fonctionnalités fiables qui soutiennent la plateforme.

Commencez à créer

Prêt à faire évoluer votre système de collecte de données ?

Rejoignez plus de 2 000 entreprises qui utilisent WebScrapingAPI pour extraire des données Web à l'échelle de l'entreprise, sans aucun coût d'infrastructure.