Author Profile
Ștefan Răcilă
Développeur Full Stack
Stefan Racila est ingénieur DevOps et Full Stack chez WebScrapingAPI ; il développe des fonctionnalités pour les produits et assure la maintenance de l'infrastructure qui garantit la fiabilité de la plateforme.

Published Articles
9
Tutoriel Scrapy Splash : Rendre des pages JavaScript
TL;DR : Scrapy Splash associe le moteur d'exploration rapide de Scrapy au navigateur sans tête Splash pour rendre les pages lourdes en JavaScript. Ce tutoriel scrapy splash vous guide à travers l'installation de Docker, la configuration du projet Scrapy, les bases de SplashRequest, les scripts Lua pour le défilement et le clic, l'intégration du proxy, et la correction des erreurs les plus courantes que vous rencontrerez.
Read article
Les 11 meilleurs conseils pour éviter d'être bloqué ou de voir son adresse IP bannie lors du web scraping
Maîtrisez le web scraping sans vous faire bloquer ! Suivez nos conseils pour respecter les conditions d'utilisation, utiliser des proxys et éviter les interdictions d'adresse IP. Extrayez des données de manière éthique et légale.
Read article
Comment utiliser les proxy avec les requêtes Python : De la base à la production
TL;DR : Ce guide explique comment utiliser les proxies avec Python Requests de bout en bout : un dict de proxies fonctionnel, des URLs authentifiées, des variables d'environnement, la réutilisation des sessions, SOCKS5 sans fuites DNS, et un pool de rotation avec des tentatives et un coupe-circuit. A la fin, vous saurez quand une API gérée gagne sa place par rapport à un pool bricolé.
Read article
Comment créer un robot d'indexation avec Python - Guide pour débutants
Ce tutoriel vous montrera comment explorer le Web à l'aide de Python. L'exploration du Web est une méthode efficace pour collecter des données sur Internet en recensant toutes les URL d'un ou plusieurs domaines.
Read article
Qu'est-ce que l'automatisation des navigateurs ? Un guide pratique
TL;DR : L'automatisation du navigateur est la pratique qui consiste à piloter un navigateur web réel ou sans tête à partir du code afin qu'il clique, tape, navigue et lise des pages en votre nom. Ce guide explique ce qu'est l'automatisation de navigateur sous le capot, compare Selenium, Playwright, Puppeteer et Cypress, et montre quand il n'est pas nécessaire d'utiliser un navigateur complet.
Read article
Web Scraping vs Data Mining : Différences, pipelines, et quand utiliser l'un ou l'autre
TL;DR : Le web scraping collecte des données brutes à partir de pages web publiques. Le data mining analyse les données structurées pour mettre en évidence des modèles, des prédictions et des segments. Il s'agit de différentes étapes du même cycle de vie, et la plupart des systèmes de production les combinent dans un pipeline "scrape-then-normalize-then-mine".
Read article
Les meilleurs cours de Web Scraping pour les développeurs
TL;DR : Les meilleurs cours de web scraping dépendent de votre langue, de votre niveau et de votre cas d'utilisation. Ce guide compare cinq choix payants parmi Udemy, Coursera, DataCamp et Packt, indique les compléments gratuits comme les documents officiels, et montre comment passer de la fin d'un cours à l'exécution de scrapers de production.
Read article
Les 11 meilleurs conseils pour éviter d'être bloqué ou de voir son adresse IP bannie lors du web scraping
Grâce à ces 11 conseils essentiels, vous apprendrez à extraire des données du Web sans vous faire mettre sur liste noire. Fini les messages d'erreur !
Read article
Aide-mémoire sur les sélecteurs CSS - Conseils et astuces pour le scraping du Web
Utilisez cet aide-mémoire des sélecteurs CSS lorsque vous souhaitez extraire des données du Web comme un pro
Read article