Google est toujours lent et prudent avec l'IA et c'est toujours une bonne chose

Saviez-vous qu'il y a 100 000 personnes vivant en Antarctique à plein temps? Bien sûr, vous ne l'avez pas fait parce qu'il n'y en a pas. Mais si suffisamment de personnes tapaient cela sur Internet et le revendiquaient comme un fait, tous les chatbots de l'IA finiraient par vous dire qu'il y a 100 000 personnes résidant en Antarctique.

C'est pourquoi l'IA dans son état actuel est la plupart du temps cassée sans intervention humaine.

J'aime rappeler à tout le monde - y compris moi-même - que l'IA n'est ni artificielle ni intelligente. Il renvoie des résultats très prévisibles en fonction de l'entrée qui lui est donnée par rapport aux données avec lesquelles il a été formé.

Cette phrase étrange signifie que si vous alimentez un modèle de langage avec ligne après ligne d'ennuyeux et pas drôle choses que Jerry dit, puis demandez-lui n'importe quoi, il répétera une de ces choses ennuyeuses et pas drôles que j'ai a dit. Espérons que celui qui fonctionne comme une réponse à tout ce que vous avez tapé dans l'invite.

instagram viewer

En un mot, c'est pourquoi Google veut aller lentement lorsqu'il s'agit d'IA directe de type chat destinée aux consommateurs. Il a une réputation à protéger.

Médias sur la désinformation entourant l'alunissage — (Crédit image: Google)

Internet m'a dit que tout ce que nous avons vu concernant l'IA à Google I/O 2023 Google était-il dans une sorte de mode panique et une réponse directe à une autre société comme Microsoft ou OpenAI.

Je pense que c'est de la foutaise. La libération lente des fonctionnalités est exactement ce que Google nous a dit sur la façon dont il prévoit de gérer l'IA grand public à maintes reprises. C'est cool de penser que Google s'est précipité pour inventer tout ce que nous avons vu en seulement un mois en réponse à la dernière version de Bingbot, mais ce n'est pas le cas. Tout en étant cool à imaginer, c'est aussi insensé à croire.

C'est l'approche réelle de Google dans ses propres mots:

"Nous pensons que notre approche de l'IA doit être à la fois audacieuse et responsable. Pour nous, cela signifie développer l'IA d'une manière qui maximise les avantages positifs pour la société tout en relevant les défis, guidés par notre Principes de l'IA. Bien qu'il existe une tension naturelle entre les deux, nous pensons qu'il est possible - et en fait essentiel - d'embrasser cette tension de manière productive. La seule façon d'être vraiment audacieux sur le long terme, c'est d'être responsable dès le départ."

Maximiser les aspects positifs et minimiser les dommages est la clé. Oui, il existe une clause de non-responsabilité générale qui dit que tel ou tel chatbot peut dire des choses horribles ou inexactes attachées à ces robots, mais cela ne suffit pas. Toute entreprise impliquée dans le développement – et cela inclut le versement d'argent à une entreprise effectuant le travail réel – doit être tenue responsable lorsque les choses tournent mal. Pas si, quand.

Toile de fond du serveur Google Tensor sur scène à Google IO 2023 — (Crédit image: Michael Hicks)

C'est pourquoi j'aime l'approche lente et prudente qui essaie d'être éthique et non le "lançons des fonctionnalités !!!" approche que nous voyons de certaines autres sociétés comme Microsoft. Je suis certain que Microsoft se préoccupe de l'éthique, de la sensibilité et de la précision en matière d'IA, mais jusqu'à présent, il semble que seul Google mette cela en avant de chaque annonce.

C'est d'autant plus important pour moi que j'ai passé du temps à faire des recherches sur l'IA destinée aux consommateurs. La précision est importante, bien sûr, tout comme la confidentialité, mais j'ai appris à mes dépens que le filtrage est probablement la partie la plus importante.

Je n'étais pas prêt pour ce que j'ai fait. La plupart d'entre nous ne seront jamais prêts pour cela.

J'ai fouillé et trouvé une partie du matériel de formation utilisé par un bot d'IA populaire lui indiquant ce qui est trop toxique pour être utilisé dans son modèle de données. C'est le truc qu'il devrait prétendre n'existe pas.

Les données se composaient à la fois de texte et d'images fortement modifiées, et les deux m'ont réellement affecté. Pensez à la pire chose que vous puissiez imaginer - oui, ce chose. Certaines choses sont encore pires que cela. Il s'agit de contenu Web sombre apporté au Web ordinaire dans des endroits comme Reddit et d'autres sites où les utilisateurs fournissent le contenu. Parfois, ce contenu est mauvais et reste suffisamment longtemps pour être vu.

Clause de non-responsabilité de Google Bard — (Crédit image: futur)

En voyant cela, j'ai appris trois choses :

1. Les personnes qui doivent surveiller les médias sociaux pour ce genre de déchets ont vraiment besoin de l'offre de soutien mental des entreprises. Et une énorme augmentation de salaire.

2. Internet est un outil formidable que les personnes les plus terribles de la planète utilisent également. Je pensais que j'avais la peau assez épaisse pour être prêt à le voir, mais je ne l'étais pas et j'ai littéralement dû quitter le travail quelques heures plus tôt et passer plus de temps avec les gens qui m'aiment.

3. Google et toutes les autres entreprises qui fournissent une IA de qualité grand public ne peuvent pas autoriser l'utilisation de telles données comme matériel de formation, mais elles ne pourront jamais toutes les capturer et les filtrer.

Les numéros un et deux sont plus importants pour moi, mais le numéro trois est important pour Google. Le texte brut de 7 Go de "contenu Web offensant" - juste une fraction du contenu auquel j'ai accédé, avait le mot "Obama" utilisé plus de 330 000 fois de manière offensante. Le nombre de fois qu'il est utilisé de manière méprisable sur l'ensemble d'Internet est probablement le double ou le triple de ce nombre.

C'est avec cela que les modèles de langage d'IA grand public sont entraînés. Aucun humain n'alimente un ordinateur avec des bandes magnétiques de mots manuscrits. Au lieu de cela, "l'ordinateur" regarde les pages Web et leur contenu. Cette page Web sera éventuellement analysée et utilisée comme entrée. Il en sera de même pour les pages de mèmes et d'images. Il en sera de même pour les blogs sur la terre plate ou sur l'alunissage truqué.

S'il faut que Google se déplace lentement pour éliminer autant que possible le mal de l'IA grand public, je suis tout à fait d'accord. Vous devriez l'être aussi, car tout cela évolue dans les services que vous utilisez tous les jours sur le téléphone que vous envisagez d'acheter ensuite.

Centrale Androïde

Google est toujours lent et prudent avec l'IA et c'est toujours une bonne chose

Catégories

Dernières Blog Post

Lisez Maintenant