Google offre aux éditeurs de sites Web un moyen de refuser d’entraîner ses modèles d’IA

Spread the love

Google a annoncé aujourd’hui qu’il offrira aux éditeurs de sites Web la possibilité de refuser que leurs données soient utilisées pour entraîner les modèles d’IA de l’entreprise, tout en restant accessibles via la recherche Google.

Google offre aux éditeurs un contrôle sur les données d’IA

Le nouvel outil, appelé Google-Extended, permet aux sites de continuer à être récupérés et indexés par des robots d’exploration comme Googlebot tout en évitant que leurs données soient utilisées pour former des modèles d’IA au fur et à mesure de leur développement au fil du temps.

La société affirme que Google-Extended permettra aux éditeurs de « déterminer si leurs sites contribuent à améliorer les API génératives de Bard et Vertex AI », ajoutant que les éditeurs Web peuvent utiliser la bascule pour « contrôler l’accès au contenu d’un site ».

Google a confirmé en juillet qu’il formait son chatbot IA, Bard, sur des données accessibles au public extraites du Web.

Google-Extended est disponible via robots.txt, également connu sous le nom de fichier texte qui informe les robots d’exploration Web s’ils peuvent accéder à certains sites.

Google note qu' »à mesure que les applications d’IA se développent », il continuera à explorer « des approches supplémentaires lisibles par machine en matière de choix et de contrôle pour les éditeurs Web » et qu’il aura bientôt davantage à partager.

En rapport

  • Bing, Bard et ChatGPT : comment l’IA réécrit Internet
  • Déjà, de nombreux sites ont décidé de bloquer le robot d’exploration Web qu’OpenAI utilise pour récupérer des données et entraîner ChatGPT, notamment le New York Times, CNN, Reuters et Medium.
  • Cependant, des inquiétudes ont été exprimées quant à la manière de bloquer Google. Après tout, les sites Web ne peuvent pas fermer complètement les robots d’exploration de Google, sinon ils ne seront pas indexés dans les recherches.
  • Cela a conduit certains sites, comme le New York Times, à bloquer légalement Google en mettant à jour leurs conditions d’utilisation pour interdire aux entreprises d’utiliser leur contenu pour former l’IA.

Commentaire

L’annonce de Google est une réponse aux préoccupations croissantes des éditeurs de sites Web concernant l’utilisation de leurs données pour entraîner les modèles d’IA.

En offrant aux éditeurs la possibilité de refuser que leurs données soient utilisées, Google cherche à apaiser ces préoccupations et à maintenir la confiance des éditeurs dans ses produits et services.

Il reste à voir comment les éditeurs répondront à cette nouvelle option. Certains peuvent choisir de continuer à permettre à Google d’utiliser leurs données, tandis que d’autres peuvent choisir de bloquer l’accès de Google à leurs sites.

Quoi qu’il en soit, l’annonce de Google est un signe que les entreprises technologiques sont conscientes des préoccupations des éditeurs et qu’elles cherchent à trouver des solutions pour les apaiser.

Source : The Verge

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *