Pour utiliser WebScrapingAPI, nous devons créer un compte et obtenir notre clé d'accès privée, qui sert à nous authentifier auprès de l'API. Pas d'inquiétude : la création de compte est gratuite et vous n'avez pas besoin d'ajouter votre carte bancaire ni d'autres informations personnelles.
Une fois connecté, vous serez redirigé vers le tableau de bord. Vous y verrez votre clé d'accès, que nous utiliserons dans quelques instants. Veillez à la conserver précieusement, mais si vous pensez que votre clé privée a été compromise, vous pouvez toujours la réinitialiser en cliquant sur le bouton « Reset API Key ».
Pour plus de détails sur le fonctionnement de WebScrapingAPI et son intégration dans votre projet, vous pouvez consulter sa documentation. Et pour tester le service, l'API Playground vous aide à visualiser encore mieux les résultats !
Assez de présentation, voyons comment utiliser WebScrapingAPI pour effectuer du scraping à l'aide de plans de site.
Pour cet exemple, nous utiliserons NodeJS comme langage de programmation, mais vous pouvez utiliser le langage de programmation avec lequel vous êtes le plus à l'aise. Ensuite, nous extrairons le plan du site et analyserons ses URL de produits, extrairons les pages de produits et stockerons les données dans un fichier CSV. De cette façon, vous pouvez extraire des données en masse à l'aide de WebScrapingAPI, mais si vous souhaitez extraire uniquement certaines pages, vous pouvez également effectuer des requêtes spécifiques.