Les modèles de langages tels que GPT-3 pourraient révolutionner la recherche en chimie

L’intelligence artificielle pourrait devenir un outil essentiel de la recherche en chimie.
L’intelligence artificielle (IA) pourrait devenir un outil essentiel de la recherche en chimie / Le Journal horaire / 36 sec. / le 6 février 2024
L'intelligence artificielle deviendra-t-elle un outil essentiel de la recherche en chimie? D'après des scientifiques de l'EPFL, les grands modèles de langages tels que GPT-3 pourraient en tout cas fournir des informations très précises tout en restant très faciles d'utilisation.

Actuellement, il est difficile d'utiliser l'intelligence artificielle basée sur l'apprentissage machine (machine learning) pour faire des prédictions fiables dans le domaine de la chimie, explique mardi l'Ecole polytechnique fédérale de Lausanne (EPFL) dans un communiqué.

Cette technique nécessite en effet de grands volumes de données, qui ne sont pas toujours disponibles dans ce domaine de recherche. Et les petits ensembles de données chimiques ne fournissent pas assez d'informations pour permettre à ces algorithmes de s’entraîner, ce qui limite leur efficacité.

Questions-réponses

L’équipe de l'EPFL pense avoir trouvé une solution basée sur les grands modèles de langage tels que GPT-3, le modèle à la base de ChatGPT. Réputés pour leurs vastes capacités de compréhension et de production de textes identiques à ceux d’un être humain, ces modèles sont pré-entraînés sur des quantités massives de textes.

"Si nous posons une question de chimie à ChatGPT, les réponses se limitent généralement à ce que l’on peut trouver sur Wikipédia", indique Kevin Jablonka, premier auteur de ces travaux publiés dans la revue Nature Machine Intelligence. Mais en "perfectionnant" GPT-3 avec un petit ensemble de données converties en questions et en réponses, il est possible de créer un modèle "capable de fournir des informations chimiques précises", ajoute le chercheur.

Aussi simple qu'une recherche documentaire

Ainsi, pendant les tests, le modèle entraîné avec relativement peu de questions-réponses a répondu correctement à plus de 95% de problèmes chimiques très divers, dépassant souvent la précision des modèles d'apprentissage machine ultramodernes.

L'un des aspects les plus frappants de cette étude est la simplicité et la rapidité de l'outil, souligne l'EPFL. Car là où les modèles d’apprentissage machine traditionnels nécessitent des mois de développement et des connaissances approfondies, l'approche développée par Kevin Jablonka et Berend Smit prend cinq minutes et ne requiert aucune connaissance particulière.

Les répercussions de l’étude sont importantes, selon les auteurs. Elle présente une méthode aussi simple qu’une recherche documentaire, applicable à divers problèmes chimiques. De plus, parallèlement à la recherche documentaire, l'interrogation d'un tel outil pourrait devenir un moyen habituel de lancer un projet en tirant parti de la connaissance collective qui y est intégrée. Des scientifiques allemands ont également contribué à ces travaux

ats/jop

Publié