Depuis quelque temps, certains observateurs avisés estiment que ChatGPT et ses semblables ont un avantage : mettre en évidence les tâches ennuyeuses et banales que nous devons accomplir chaque jour, comme résumer des rapports, envoyer des courriels au patron, écrire du code standard, faire ses devoirs, etc. Selon les chercheurs Fabrizio Gilardi, Meysam Alizadeh et Maël Kubli de l'université de Zurich, les modèles d'apprentissage automatique peuvent effectuer des travaux de traitement de contenu et d'assainissement de données mieux et à moindre coût que les personnes participant à des plateformes de crowdsourcing.Le crowdsourcing est la pratique qui correspond à faire appel au grand public ou aux individus à l'extérieur de l'entreprise. C’est une forme d'externalisation, voire de collaboration possible avec des individus à l'extérieur de l'entreprise. Il constitue une alternative aux autres formes de production comme la réalisation en interne, l'externalisation classique ou l'innovation en réseaux.
Dans le cadre du crowdsourcing, les prestataires professionnels ou amateurs peuvent alors être récompensés, rémunérés ou parfois uniquement valorisés lorsque leurs créations sont choisies par l'annonceur ou parfois simplement pour leur effort de participation.
Les chercheurs Fabrizio Gilardi, Meysam Alizadeh et Maël Kubli ont examiné comment le grand modèle de langage ChatGPT d'OpenAI traitait l'annotation de texte - l'ajout d'étiquettes au texte pour aider les modèles d'apprentissage automatique à mieux le comprendre - par rapport à la plateforme de crowdsourcing Amazon Mechanical Turk (MTurk).
Amazon Mechanical Turk
Amazon Mechanical Turk (MTurk) est une place de marché pour la réalisation de tâches virtuelles nécessitant une intelligence humaine. Le service Mechanical Turk permet aux entreprises d'accéder à une main-d'œuvre diversifiée, à la demande et évolutive, et offre aux travailleurs une sélection de milliers de tâches à accomplir au moment qui leur convient.
« Amazon Mechanical Turk a été créé parce que nous savons qu'il y a beaucoup de choses que les êtres humains font beaucoup plus efficacement que les ordinateurs, comme l'identification d'objets dans une photo ou une vidéo, la déduplication de données, la transcription d'enregistrements audio ou la recherche de détails sur des données. Les clients demandeurs peuvent confier ces tâches à la main-d'œuvre de Mechanical Turk. Traditionnellement, ces tâches étaient accomplies en recrutant une importante main-d'œuvre temporaire (ce qui prend du temps, coûte cher et est difficile à faire évoluer) ou n'étaient pas réalisées », précise Amazon.
L'IA générative, expliquée
Les chercheurs de Goldman Sachs ont examiné l'état actuel du développement de l'IA et ses principales capacités. Le tableau ci-dessous donne un aperçu de l'IA générative, en comparaison avec les méthodes d'apprentissage automatique qui l'ont précédée, parfois appelées IA étroite ou analytique.
Vue d'ensemble de l'IA générative
Selon leur évaluation, les technologies d'IA générative actuellement à l'étude, telles que ChatGPT, DALL-E et LaMDA, se distinguent par trois caractéristiques principales :
- leurs cas d'utilisation généralisés plutôt que spécialisés ;
- leur capacité à générer des nouveaux résultats, de type humain, plutôt que de se contenter de décrire ou d'interpréter des informations existantes ;
leurs interfaces accessibles qui comprennent le langage naturel, les images, le son et la vidéo et y répondent. Les deux premières avancées sont essentielles pour élargir l'ensemble des tâches que l'IA peut accomplir, tandis que la troisième est déterminante pour le calendrier de son adoption.
Tout comme la migration de la programmation en ligne de commande (par exemple, MS-DOS) vers des interfaces utilisateur graphiques (par exemple, Windows) a permis le développement de programmes (par exemple, Office) qui ont mis la puissance de l'ordinateur personnel à la portée du plus grand nombre, les interfaces intuitives de la génération actuelle de technologies d'IA pourraient accélérer de manière significative leur adoption. Par exemple, ChatGPT a dépassé les 1 million d'utilisateurs en seulement 5 jours, ce qui est la première fois qu'une entreprise atteint ce niveau de référence.
ChatGPT
ChatGPT a pris le monde d'assaut depuis son lancement en novembre, avec son habileté à écrire des essais, des articles, des poèmes et du code informatique en quelques secondes seulement.
ChatGPT est un robot à grand modèle de langage (ils permettent de prédire le mot suivant dans une série de mots) développé par OpenAI et basé sur GPT-3.5. Il a une capacité remarquable à interagir sous forme de dialogue conversationnel et à fournir des réponses qui peuvent sembler étonnamment humaines.
L'apprentissage par renforcement avec retour d'information humain (RLHF) est une couche supplémentaire de formation qui utilise le retour d'information humain pour aider ChatGPT à apprendre à suivre des instructions et à générer des réponses satisfaisantes pour les humains. ChatGPT a été créé par OpenAI, une société d'intelligence artificielle basée à San Francisco, connue pour son célèbre DALL-E, un modèle d'apprentissage profond qui génère des images à partir d'instructions textuelles appelées "prompts".
Au-delà de ces changements, l'augmentation exponentielle de la puissance de calcul disponible a permis des progrès rapides dans la complexité des tâches que l'IA peut effectuer et dans la précision avec laquelle elle peut les exécuter. Par exemple, la dernière itération du modèle GPT d'OpenAI - GPT-4, publié en mars 2023, environ un an après la fin de la formation du modèle GPT-3.5 qui sous-tend actuellement ChatGPT - obtient 150 points de plus au SAT que son prédécesseur, est 40 % plus susceptible de produire des réponses précises et peut désormais accepter des données visuelles (et non plus seulement du texte).
Comme le montre le tableau Ci-dessus, les algorithmes qui sous-tendent l'IA générative avaient commencé à dépasser les références humaines pour des tâches telles que la classification d'images et la compréhension de la lecture, même avant ces récentes avancées....
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Quels compromis seriez-vous prêt à accepter pour permettre l’innovation en IA tout en protégeant les droits des auteurs ?
