La lecture de "Guerre et Paix", le roman monumental de Léon Tolstoï qui compte un demi-million de mots et souvent plus de 1 000 pages, pourrait être l'affaire d'une minute pour un nouveau modèle d'intelligence artificielle de Google.

La société Alphabet a présenté jeudi Gemini 1.5, une mise à jour de sa suite de modèles d'intelligence artificielle annoncée il y a deux mois. En une seule invite, un utilisateur peut demander à l'intelligence artificielle de Google d'analyser beaucoup plus de contenu qu'auparavant - 30 000 lignes de code, 11 heures de son, une heure entière de vidéo, a déclaré Google.

Ce chiffre s'applique à Pro, le modèle de taille moyenne de la famille. Concrètement, Pro peut traiter 1 million de données appelées "tokens" (jetons), soit cinq fois la quantité de données qu'Anthropic, peut-être le concurrent le plus proche dans ce domaine, traite dans une requête de sa technologie Claude 2.1.

Reuters n'a pas été en mesure de vérifier ces affirmations de manière indépendante.

L'IA de plus en plus vorace de Google, dans la foulée des publications d'OpenAI, le créateur de ChatGPT, et d'autres, reflète la course à l'armement rapide en cours dans la Silicon Valley pour construire la technologie la plus performante - et la plus commercialisable - à ce jour.

Dans une interview accordée à Reuters, Sundar Pichai, PDG d'Alphabet, a présenté cette avancée comme l'une des multiples "percées" qui alimenteront la myriade d'activités de son entreprise. À la base, a-t-il dit, le pilier de l'industrie de la recherche rendait possible une nouvelle façon de s'informer.

"Vous donnez aux gens une vision plus large pour poser des questions sur le monde".

Un exemple dont Google a discuté en interne est celui d'un cinéaste qui pourrait demander à l'IA de juger un film brut de décoffrage comme le ferait un critique, a expliqué M. Pichai. "Ce n'est qu'un cas d'utilisation dont nous avons discuté en équipe, mais il n'y a pas de limite à ce que nous pouvons faire", a-t-il déclaré.

Un autre cas d'utilisation est la recherche de rapports financiers de plusieurs entreprises en une seule fois, a déclaré M. Pichai. Des démonstrations à la presse ont montré comment l'IA pouvait extraire des informations d'une vidéo de 44 minutes en 59 secondes environ, ainsi que des messages multimodaux, dans lesquels un utilisateur demandait à l'IA de répondre à une combinaison de texte et d'images.

Outre l'apport d'une technologie actualisée à Google Search et à YouTube, Alphabet compte sur Gemini 1.5 pour attirer des clients vers son unité "cloud". En concurrence avec son grand rival Microsoft, qui soutient OpenAI, Alphabet a récemment constaté un rebond de la croissance du chiffre d'affaires de cette division.

À partir de jeudi, Google a déclaré qu'il ouvrirait son IA d'un million de jetons à un nombre limité de clients professionnels, tandis que tout développeur pourrait construire avec la version 1.0 et échanger avec la dernière génération une fois qu'elle sera disponible.

Interrogé sur la question de savoir quand des modèles d'IA aussi puissants, généralement coûteux, seraient rentables pour Alphabet, M. Pichai a répondu : "Il s'agit de choses rentables pour nous : "Il s'agit de choses rentables pour nous. De plus, avec le temps, nous serons très, très efficaces dans l'utilisation de ces modèles".

L'efficacité est une autre amélioration que Google a soulignée pour Gemini 1.5. Google a déclaré avoir mis en œuvre un moyen moins onéreux pour l'IA de recueillir des informations, connu sous le nom de "mélange d'experts", conformément à ses recherches antérieures et à l'annonce récente d'un concurrent.

Un responsable de l'entreprise a comparé cette approche au fait d'appeler un savant pour répondre à une question, plutôt que d'appeler toutes les personnes que l'on connaît.