Comment créer des scrapers éthiques ?
Lorsque vous dirigez une entreprise, vous devez faire preuve de prudence en matière de web scraping, car vos concurrents pourraient s'en servir contre vous. Pour vous protéger et être un bon citoyen numérique respectueux des lois, vous pouvez suivre plusieurs étapes lors de la création et de l'utilisation de vos scrapers web.
Réfléchissez-y à deux fois avant de collecter des données personnelles
Si les données collectées peuvent être utilisées pour identifier une personne, assurez-vous d'obtenir son consentement avant de les extraire.
Ces données peuvent inclure des informations officielles sur une personne, ses coordonnées, ses données comportementales, ses préférences d'achat, sa localisation (par adresse ou GPS), des enregistrements vidéo et audio de personnes, ainsi que des données biométriques, le sexe, le genre, l'orientation sexuelle et les dossiers médicaux, entre autres.
Données personnelles accessibles au public
En matière de web scraping, beaucoup de gens croient à tort que seules les données personnelles privées sont protégées. Mais qu'est-ce que cela signifie exactement ? Et est-il vraiment acceptable de collecter des données personnelles à partir de sources publiques telles que des sites web ? Tout dépend.
Une entreprise de l'UE s'est vu infliger une lourde amende pour avoir extrait des données publiques du registre du commerce polonais. Bien que le tribunal ait par la suite annulé l'amende, il a confirmé l'interdiction d'extraire des données accessibles au public.
Selon la CCPA, les informations publiées par les pouvoirs publics, telles que les données du registre du commerce, sont « accessibles au public » et ne sont pas classées comme protégées.
La décision la plus récente concernant l'extraction de données accessibles au public à partir des réseaux sociaux aux États-Unis a suscité de nombreuses controverses. L'affaire HiQ contre LinkedIn porte sur la question de savoir s'il est légal ou non d'extraire des informations personnelles rendues publiques par la personne concernée.