Résumé de l’article
L'Agence France-Presse met 30 ans de dépêches au service d'une start-up d'IA générative
Il s'agit du premier accord de ce type pour l'agence mondiale, ainsi que pour Mistral, concurrent des géants américains comme OpenAI qui ambitionne de devenir le principal acteur européen dans le domaine de l'intelligence artificielle.
Dans le monde, ce type d'accord reste relativement rare, même si les choses se sont accélérées en 2024. La société californienne OpenAI a notamment signé avec le journal économique britannique Financial Times, le quotidien français Le Monde ou encore le groupe allemand Springer (Bild).
Ni le montant ni la durée de ce contrat "pluriannuel" n'ont été dévoilés.
Trente ans et 38 millions de dépêches
Dès jeudi, les dépêches de l'AFP en six langues (français, anglais, espagnol, arabe, allemand, portugais) pourront être utilisées par le robot conversationnel de Mistral, sobrement baptisé Le Chat.
Il pourra ainsi puiser dans toutes les archives texte de l'agence depuis 1983, mais pas dans ses photos, vidéos ou infographies. Au total, cela représente 38 millions de dépêches, a précisé le PDG de l'AFP Fabrice Fries.
Quand la question concernera l'actualité, Le Chat formulera ses réponses en se puisant des informations dans les dépêches, c'est-à-dire les informations envoyées sous forme de texte par l'agence à ses clients.
Sources complémentaires
Une phase de test a lieu dans un premier temps, auprès d'une partie des utilisateurs.
Cet usage vise "des professions libérales, des cadres de grandes entreprises", par exemple pour "préparer des mémos" liés à l'actualité. Mais il servira aussi au grand public, de plus en plus nombreux à utiliser des outils d'IA générative.
Deux usages "complémentaires", a estimé le patron de Mistral, Arthur Mensch. Pour des questions "qui nécessitent de l'information vérifiée, c'est l'AFP qui fournira" le matériau de base des réponses. Et quand les requêtes porteront "sur le shopping ou la météo par exemple, c'est plutôt le web", a-t-il détaillé.
"Module complémentaire"
Mistral AI fournit aussi un grand modèle de langage (Mistral Large) spécialisé sur la génération de texte et des modèles spécialisés capables de traiter des images ou générer du code.
Toutefois, contrairement à d'autres accords de ce type, les contenus AFP ne serviront pas à entraîner et faire progresser ces modèles informatiques, ont assuré les deux parties.
Contexte particulier
Pour Mistral, "l'AFP apporte une source vérifiée, journalistique, dont on pense qu'elle est très importante", a commenté Arthur Mensch.
La signature intervient peu après l'annonce par le groupe Meta de l'arrêt de son programme de fact-checking, dont l'AFP était l'un des principaux contributeurs mondial. Et des voix de plus en plus nombreuses s'inquiètent du virage des plateformes américaines sur la question de la désinformation, dans la foulée du rachat de la plateforme X par Elon Musk.
Dans ce contexte, les deux groupes revendiquent des "racines européennes affirmées", a souligné Fabrice Fries.
jop avec afp
Mistral, vers une IA en source ouverte à l'européenne?
Apparue il y a moins de deux ans, Mistral AI a connu une ascension fulgurante jusqu'à représenter le principal espoir européen face aux mastodontes américains. L'entreprise a levé cet été 600 millions d'euros, la plus grosse levée de fonds de la French Tech en 2024, portant sa valorisation à près de six milliards d'euros, selon le cabinet KPMG. Elle n'est pourtant pas rentable à l'heure actuelle.
"Dans les dix années qui viennent, notre ambition est d'être un des acteurs qui façonnent la technologie et la manière dont on l'utilise", explique Arthur Mensch dans une communication de l'AFP jeudi.
"C'est une étoile filante" qui est arrivée au moment où les investisseurs voulaient voir émerger un "OpenAI à la française", note Claude de Loupy, expert en intelligence artificielle appliquée aux langues. Sa force a été de présenter dès ses débuts des modèles "d'excellente facture", ajoute-t-il.
L'entreprise a fait le pari de modèles open source, c'est-à-dire en accès libre au code de programmation, à l'opposé la plupart de ses concurrents américains, comme OpenAI, accusés d'être des boîtes noires.
Forte d'une centaine de salariées et salariés, Mistral souhaite s'agrandir, mais elle "affronte des géants comme Google, Meta, Microsoft, Amazon" contre lesquels il est compliqué "de lutter à armes égales", analyse l'expert.
Malgré un fort soutien politique, il sera donc difficile de rester dans la course mondiale à l'IA dans la durée. "On a de la demande en permanence aujourd'hui", note toutefois Arthur Mensch. Il appelle les investisseurs à "s'unir et se responsabiliser devant le fait qu'il faut soutenir la technologie européenne", ajoutant: "C'est utile à long terme, et puis même à court terme, de travailler avec des acteurs locaux".
Contrat ou procès?
Depuis l'essor de l'IA générative, certains médias ont conclu des accords permettant à des acteurs de l'IA d'utiliser leurs contenus tandis que d'autres les poursuivent en justice en les accusant de les piller. Les signatures se sont toutefois accélérées en 2024, même si elles sont encore relativement rares.
Beaucoup concernent OpenAI, société américaine conceptrice de ChatGPT. Les modalités peuvent différer d'un contrat à l'autre. Mais leur philosophie générale est d'autoriser les systèmes d'IA générative à s'appuyer sur les contenus des médias partenaires pour produire leurs textes, moyennant paiement.
Le groupe allemand Axel Springer (éditeur du tabloïd Bild) a été l'un des pionniers. Il a successivement signé en décembre 2023 avec OpenAI, puis en avril 2024 avec Microsoft. Début 2024, OpenAI a conclu des contrats similaires avec d'autres journaux, dont le quotidien français Le Monde, qui explique y voir un "premier dispositif de protection de son travail et de ses droits" face à la "révolution de l'IA", autant qu'une "source significative de revenus supplémentaires" en pleine crise économique des médias.
Toutefois, en juin 2024, l'Agip et le SEPM, deux organismes représentant 800 quotidiens et magazines de la presse française, ont appelé les principaux acteurs de l'IA à négocier. OpenAI leur a opposé une fin de non-recevoir, rejetant le principe d'une négociation groupée. Ces organismes pourraient donc bientôt entamer des poursuites.
Depuis quelques années, la presse française ferraille déjà en justice avec les géants d'internet, comme Google, Microsoft ou X, dans le dossier des droits voisins, c'est-à-dire le fait de payer pour afficher des contenus de presse. "L'IA et les rapports avec les plateformes sont des sujets qui mettent en jeu l'existence même de la presse", souffle un grand patron de médias français.
Ainsi, à rebours de ces accords, d'autres médias ont choisi le bras de fer et traînent les acteurs de l'IA en justice. Ils leur reprochent d'avoir utilisé leurs contenus piochés sur internet sans payer. Le prestigieux quotidien américain The New York Times est à la pointe de cette bataille judiciaire. Il a été suivi par une dizaine d'autres journaux américains, dont le Wall Street Journal et le New York Post, qui attaquent principalement OpenAI et Microsoft, ainsi que d'autres entreprises d'IA.