Modalités d’utilisation

1. Champ d’application

L’accès à la plateforme est gratuit, sans inscription et entraîne l’application de conditions spécifiques, listées dans les présentes modalités d’utilisation.

2. Définitions

« Utilisateur » désigne toute personne physique consultant la plateforme et qui bénéficie de ses services.

« Éditeur » désigne le Service du numérique du Ministère de la Culture.

« Plateforme » désigne le site web qui rend les services accessibles.

« Modèles » désigne les grands modèles de langages (LLM) réutilisés dans le cadre de leur licence d’utilisation par la plateforme pour répondre à ses finalités.

« Services » désigne les fonctionnalités offertes par la plateforme pour répondre à ses finalités.

3. Description de la plateforme

Édité par le Service du numérique du Ministère de la Culture, le comparateur est une plateforme de comparaison des modèles conversationnels adressée au grand public dans le but (1) de sensibiliser les citoyens aux grands modèles de langage (LLMs), (2) de collecter les préférences des utilisateurs pour constituer des jeux de données d’alignement.

L’utilisateur ou l’utilisatrice pose une question en français et obtient des réponses de deux grands modèles de langages (LLM) anonymes. Il ou elle vote pour le modèle qui fournit la réponse qu’il préfère et se voit alors révélée l’identité des modèles. Ce dispositif de production participative inspiré de la plateforme « chatbot arena » (LMSYS) permet de constituer des jeux de données de préférences humaines sur des tâches réelles, en français, utilisables pour l’alignement des modèles.

Ces jeux de données seront rendus accessibles sous licence ouverte, notamment pour favoriser des usages de recherche.

4. Fonctionnalités

Afin de répondre au double objectif de sensibiliser les citoyens aux grands modèles de langage et collecter les préférences des utilisateurs et utilisatrices, les services rendus par la plateforme sans restriction d’accès sont les suivants :

Les modèles intégrés à la plateforme sont déployés sur les serveurs d’inférence des différents partenaires (Scaleway, OVH, Hugging Face, Google Cloud, Mistral Ai). Les conditions de standardisation d’inférence sont renseignées sur la plateforme pour garantir la transparence d’utilisation des modèles.

A l’issue du parcours de vote, l’utilisateur peut consulter la liste des modèles intégrés au comparateur et accéder à une liste d’informations sur ces modèles. Les informations documentant les modèles sont sourcées.

Le service recueille les données de dialogue et de préférence des utilisateurs. Les jeux de données partagés comprendront les questions de l’utilisateur, les réponses des deux modèles, le vote et les préférences de l’utilisateur.

L’éditeur se réserve le droit de distribuer sous licence ouverte 2.0 les données de dialogue et de préférence de l’utilisateur. Le jeu de donnée est diffusé sur la plateforme Hugging Face à travers le compte du ministère de la culture (https://huggingface.co/ministere-culture).

5. Responsabilités

L’utilisateur est responsable des données ou contenus qu'il ou elle saisit dans l’invite offert par la plateforme.

La plateforme n’a pas vocation à être utilisée pour générer des contenus illicites ou contraires à l’ordre public et plus généralement toute génération contrevenant au cadre juridique en vigueur.

A cet égard, l’utilisateur ne saisit pas dans l’invite des contenus ou informations contraires aux dispositions légales et réglementaires en vigueur.

Les données saisies par l’utilisateur sur la plateforme ayant vocation à être mis à disposition, il ou elle s’engage à ne pas transmettre d’informations permettant de l’identifier ou d’identifier un tiers.

En tout état de cause, l’éditeur s’engage à mettre en œuvre les moyens permettant de s’assurer de l’anonymisation les données de dialogue avant leur mise à disposition.

De manière générale, l’éditeur se dégage de toute responsabilité en cas d’utilisation non-conforme aux modalités d’utilisation.

6. Code et licences

Le code source de la plateforme est libre et disponible ici : https://github.com/betagouv/languia

Les LLM utilisés pour alimenter les services sont régis par les licences suivantes :

Modèle d’IA conversationnelle Lien vers la notice des modèles Licence
Chocolatine 14B https://huggingface.co/jpacifico/Chocolatine-14B-Instruct-DPO-v1.2-Q4_K_M-GGUF MIT
Gemini 1.5 Pro https://ai.google.dev/gemini-api propriétaire Gemini
Gemma 2 27b https://huggingface.co/google/gemma-2-27b-it Gemma
Gemma 2 9B https://huggingface.co/google/gemma-2-9b-it Gemma
Hermes 3 405B https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-405B Llama 3.1
LFM 40B MoE https://www.liquid.ai/liquid-foundation-models propriétaire Liquid
Llama 3.1 405B https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct Llama 3.1
Llama 3.1 70B https://huggingface.co/meta-llama/Meta-Llama-3.1-70B-Instruct Llama 3.1
Llama 3.1 8B https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct Llama 3.1
Llama 3.1 Nemotron 70B https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct Llama 3.1
Ministral https://huggingface.co/mistralai/Ministral-8B-Instruct-2410 Mistral AI Non-Production
Mistral Nemo https://huggingface.co/mistralai/Mistral-Nemo-Instruct-2407 Apache 2.0
Mixtral 8x22B https://huggingface.co/mistralai/Mixtral-8x22B-Instruct-v0.1 Apache 2.0
Mixtral-8x7B https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1 Apache 2.0
Phi-3.5-mini https://huggingface.co/microsoft/Phi-3.5-mini-instruct MIT
Qwen2.5-7B https://huggingface.co/Qwen/Qwen2.5-7B-Instruct Apache 2.0

La liste des modèles de langage intégrés à la plateforme est susceptible d’évoluer au cours du temps et est mise à jour à chaque modification.

7. Disponibilité des services

La plateforme est accessible, sauf cas de force majeure ou d’évènement hors de contrôle de son éditeur.

L’éditeur se réserve le droit de suspendre, d'interrompre ou de limiter, sans avis préalable, l'accès à tout ou partie des services, notamment pour des opérations de maintenance et de mises à jour nécessaires au bon fonctionnement du service et des matériels afférents, ou pour toute autre raison, notamment technique.

Il n’est pas garanti que le service soit exempt d’anomalies ou erreurs. Le service est donc mis à disposition sans garantie sur sa disponibilité et ses performances.

A ce titre, l’éditeur ne saurait être tenu responsable des pertes ou préjudices, de quelque nature qu’ils soient, qui pourraient être causés à la suite d’un dysfonctionnement ou une indisponibilité du service. De telles situations n'ouvriront droit à aucune compensation financière.

8. Évolution des modalités d'utilisation

Les modalités d’utilisation peuvent être modifiées ou complétées à tout moment, sans préavis, en fonction des modifications apportées aux services, de l’évolution de la législation ou pour tout autre motif jugé nécessaire.

Ces modifications et mises à jour s’imposent à l’utilisateur ou l’utilisatrice qui doit, en conséquence, se référer régulièrement à cette rubrique pour vérifier les modalités générales en vigueur.

9. Contact

Pour toute question sur le service, vous pouvez écrire à contact@comparia.beta.gouv.fr.