Une startup dévoile en avril 2023 une alternative de ChatGPT qui répond aux normes de la RGPD. Baptisée Dolly, cette intelligence artificielle est entraînée par des employés de Databricks. Cette technique, différente de celle utilisée par ChatGPT, permettrait à l’IA de fournir des réponses plus respectueuses. Dolly intéresse les chercheurs et apporte une nouvelle dimension à la course aux IA.
Actuellement, plusieurs versions de ChatGPT sont en développement ou déjà disponibles. Toutefois, elles présentent la même faille, un manque de transparence. Par ailleurs, ChatGPT a été arrêté en urgence en Italie pour non-respect du RGPD. La France compterait également procéder au blocage de la plateforme suite à de nombreuses plaintes rapportées au CNIL.
Suite aux craintes sur l’utilisation des données amassées par le chatbot, Databricks dévoile Dolly 2.0 le 12 avril 2023. Cette intelligence artificielle garantit une utilisation gratuite et elle mise sur la transparence. Comme ChatGPT, Dolly pourra aider les utilisateurs pour des requêtes basiques ou des recherches d’idées de mission freelance.
La rivalité entre les IA
Databricks définit Dolly sur son blog comme étant :
[…] le premier jeu de données d’instruction à source ouverte généré par l’homme et spécifiquement conçu pour que de grands modèles de langage présentent l’interactivité magique de ChatGPT.
En ce sens, un tournant important est attendu dans l’industrie de l’intelligence artificielle. L’IA signée Databricks est un affront aux GAFAM. Pourtant, les géants de la Tech disposent des ressources financières et technologiques pour répondre à l’attaque de Dolly. De plus, GPT-4 n’aurait rien à envier à Dolly 2.0. Sa version ultérieure 3.5 est basée sur 175 milliards de paramètres , une valeur plus importante que celle de Dolly.
Malgré le fait que Dolly ne soit pas connue du grand public, son lancement enthousiasme les experts. Au cours d’une interview avec ArsTechnica, le chercheur Simon Willison parle de ses aspirations par rapport au lancement de cette IA :
[…] je m’attends à ce que nous voyions bientôt un tas de nouveaux projets utilisant ces données d’entraînement. Et certains d’entre eux pourraient produire quelque chose de vraiment utile.
Simon Willison
En ce sens, Dolly est vu comme la première version d’une génération de chatbots opensource.
L’IA plus éthique
Contrairement à ChatGPT, les codes de Dolly sont disponibles en opensource. En effet, les utilisateurs peuvent accéder librement aux balises de programmation de l’IA. Dolly se base sur le modèle Pythia d’EleutherAI et Databricks se serait assuré de la qualité des réponses du Chatbot.
Ajouté à cela, Dolly est accessible gratuitement et serait aussi performant que GPT-4. Ce qui différencie également les deux IA, c’est leur entraînement. En effet, contrairement à ChatGPT, Dolly est d’abord paramétrée en suivant un crowdsourcing de 5000 employés de Databricks. Cette démarche a pour but d’entraîner l’IA pour qu’elle donne des réponses adaptées aux utilisateurs. Sa base de données intègre également 12 milliards de paramétrages le rendant performant.
En évitant le même parcours d’entraînement que GPT, Dolly suit des règles d’éthique. Plus respectueux, ce chatbot ne semble pas résulter d’une initiative privée. En somme, ce nouveau générateur semble pouvoir rivaliser avec le robot conversationnel d’OpenAI.