La guerre des intelligences artificielles génératives a démarré il y a environ un an et, depuis, les concurrents de ChatGPT se sont multipliés. Mais l’IA d’OpenAI est-elle la plus performante ? Ce n’est pas le cas selon cette étude.
Début 2023, ChatGPT, l’intelligence artificielle générative de la firme américaine OpenAI, a défrayé la chronique en ouvrant la porte à de nouveaux usages qui ont rapidement bouleversé l’univers des nouvelles technologies. Aujourd’hui, GPT4 est utilisé par des millions de personnes à travers le monde, c’est un fait.
Mais la hausse de popularité fulgurante de ChatGPT a rapidement motivé des concurrents à se lancer eux aussi, avec plus ou moins de succès. On se souvient notamment du fiasco de l’annonce de Bard, l’IA de Google. Un an plus tard, qu’en est-il ?
Quatre IA génératives mises en compétition
Le site Search Engine Land s’est penché dès mars 2023 sur l’efficacité de quatre intelligences artificielles génératives proposées, à l’époque, sur le marché : ChatGPT d’Open AI, Bard de Google, ainsi que Bing Chat Balanced et Bing Chat Creative. Pour l’expérience, le journaliste s’était alors basé sur 30 requêtes dans différents domaines et sur 4 critères : la manière dont l’IA s’aligne sur le sujet demandé, la précision de la réponse, la complétude et enfin sa qualité.
En mars 2023, ChatGPT était arrivé en tête en termes de précision (81,5%), suivi des solutions de Bing (77,8%) et enfin de Google Bard. Sur les autres critères, ChatGPT était aussi en tête, hormis sur la complétude où Bing Chat Creative faisait alors un peu mieux.
Et en janvier 2024, est-ce que les choses ont changé ? Dans la mise à jour de l’expérience, Search Engine Land a décidé d’ajouter Claude Pro, l’IA développée par Anthropic. Cette fois-ci, ce sont 44 requêtes qui ont été utilisées.
ChatGPT doublé par Google Bard
Le résultat de la nouvelle expérience montre que Bard obtient désormais les meilleurs scores globaux. ChatGPT, de son côté, parvient encore à s’en sortir avec les honneurs concernant la pertinence de la réponse sur le sujet, mais il est en retrait sur tous les autres tableaux.
L’intelligence artificielle d’OpenAI s’est notamment montrée plutôt mauvaise concernant sa connaissance des événements récents, l’accès aux pages Web récentes, et l’accès aux données locales. L’étude monde que ChatGPT peut se montrer plus pertinent si on lui ajoute certains plugins, mais au naturel, elle fait moins bien la concurrence. L’IA Claude d’Anthropic n’a pas non plus brillé durant le test, dont Bard de Google ressort clairement vainqueur dans l’immédiat.
Le secteur des IA, un monde en mouvement
Le travail de Search Engine Land est très intéressant, car il montre clairement qu’une intelligence artificielle performante un jour peut rapidement être distancée par un concurrent réactif qui parvient à s’adapter aux exigences du moment. Il y a un an, nous n’aurions pas forcément misé sur Bard, et pourtant, il s’avère que Google a réussi à faire de belles avancées en l’espace de quelques mois.
Mais le secteur de l’intelligence artificielle générative évolue de jour en jour, et il y a fort à parier que la concurrence va continuer à s’intensifier, notamment avec des acteurs comme Meta ou Apple. Les résultats d’une expérience du même type pourraient donc encore fortement évoluer dans les mois à venir.