Author Profile

Sorin-Gabriel Marica

Développeur full-stack

Sorin Marica est ingénieur Full Stack et DevOps chez WebScrapingAPI ; il développe des fonctionnalités pour les produits et assure la maintenance de l'infrastructure qui garantit le bon fonctionnement de la plateforme.

Python web scrapingGuidesEngineering
Sorin-Gabriel Marica, Développeur full-stack @ WebScrapingAPI

Published Articles

6

Published Articles
Science of Web ScrapingMay 1, 202613 min read

Web Scraping avec Node-Unblocker : Un guide pratique

TL;DR : Node-unblocker transforme une application Express en un proxy HTTP à préfixe d'URL que vous pouvez pirater. Ce guide de node-unblocker pour le web scraping explique comment l'installer, configurer des middlewares de requête et de réponse, faire tourner les instances, les déployer sur Docker ou Heroku, et reconnaître le moment où une API de scraping gérée est la solution la plus saine.

Read article

GuidesApr 30, 202620 min read

Web Scraping avec PHP : Un guide pratique des bibliothèques, du code et des meilleures pratiques

TL;DR : PHP est un langage parfaitement adapté au web scraping, grâce à des extensions intégrées comme cURL et DOMDocument, ainsi qu'un riche écosystème Composer qui inclut Guzzle, Symfony DomCrawler, et Symfony Panther pour la navigation sans tête. Ce guide vous guide à travers le flux de travail complet : récupérer les pages, analyser le HTML, stocker les résultats en CSV/JSON/MySQL, gérer les erreurs, et éviter les blocages.

Read article

EngineeringApr 10, 20266 min read

Contraintes architecturales de l'API REST

Les API se présentent sous toutes sortes de formes. Parmi elles, les API REST sont sans doute les plus répandues, mais qu'est-ce qui les caractérise exactement ? Eh bien, voyons cela de plus près !

Read article

GuidesApr 22, 20269 min read

Découvrez comment utiliser Node-Fetch (NPM) pour effectuer des requêtes HTTP dans Node.js

Découvrez comment utiliser le tout nouveau module node-fetch pour effectuer des requêtes HTTP directement depuis Node.js. Node-fetch est l'équivalent de l'API Fetch en JavaScript.

Read article

GuidesApr 22, 20269 min read

Le guide complet pour se lancer dans le web scraping avec Go

Voici un guide complet sur l'utilisation de Go pour le web scraping. Découvrez comment créer un outil de web scraping rapide en tirant parti des puissantes capacités de concurrence de Golang.

Read article

GuidesMay 12, 202620 min read

Tutoriel BeautifulSoup : Construire un vrai scraper Python à partir de zéro

TL;DR : Ce tutoriel BeautifulSoup vous guide à travers un scraper Python complet, de l'installation du pip à un script renforcé qui pagine Hacker News, exporte au format CSV et JSON, et reste suffisamment poli pour ne pas être bloqué. Chaque extrait est exécutable, et nous indiquons les moments exacts où BeautifulSoup n'est pas le bon outil.

Read article