Créer votre propre chatbot IA ? Voici le logiciel libre HuggingChat

Technologie : ChatGPT domine peut-être la hype autour de l'IA générative. Mais si vous êtes super-geek, vous pouvez construire votre propre chatbot en utilisant HuggingChat et quelques autres outils. Voici comment faire.

Par David Gewirtz

  • 5 min

gettyimages-1246536583

Dans cet article, nous jetons un coup d’œil rapide à un chatbot IA de type ChatGPT d’une société appelée de manière improbable Hugging Face. Je n’ai pas pu examiner le produit sérieusement avant d’avoir demandé au chatbot HuggingChat : « Pourquoi votre entreprise s’appelle-t-elle Hugging Face ? »

Voici ce que l’IA m’a répondu :

Le nom « Hugging Face » vient de notre objectif de construire des modèles d’IA capables d’interagir de manière significative et positive avec les humains à un niveau personnel, de la même manière qu’une personne pourrait étreindre quelqu’un qui lui est cher.

Comme vous pouvez le voir sur l’interface de HuggingChat, l’entreprise a résolument opté pour le look and feel ChatGPT :

cleanshot-2023-07-08-at-14-24-592x

Capture d’écran par David Gewirtz/ZDNET

Mais il y a de grandes différences, la plus notable étant qu’il s’agit d’un logiciel libre. C’est ici sur Github.

Si HuggingChat intéressera surtout les développeurs et les spécialistes de l’IA, tout le monde peut jouer avec l’outil en ligne. Une chose à noter cependant : presque toutes les discussions sur l’interface en ligne de HuggingChat indiquent qu’elle ne recueille aucune information et qu’elle ne nécessite pas de connexion. C’était peut-être le cas pour la toute première version, mais ce n’est plus le cas :

cleanshot-2023-07-08-at-11-34-222x

Capture d’écran par David Gewirtz/ZDNET

Utilisation de la version Web de HuggingChat

J’ai dû créer un compte auprès de Hugging Face pour accéder à l’interface utilisateur. Et comme je n’ai pas désactivé l’envoi des données de chat aux développeurs pour qu’ils les examinent, je tiens à m’excuser auprès d’eux pour les grossièretés proférées ! Je voulais juste voir ce que cela pouvait donner.

Une autre précision s’impose. Tout au long de cet article, lorsque je parle de la version web de HuggingChat, je fais référence à la version que Hugging Face fournit à l’adresse hf.co/chat. Il existe probablement des centaines d’autres versions web de HuggingChat, réalisées par des centaines d’autres développeurs. C’est la nature même de l’open source. Mais là, nous parlons de la version que Hugging Face met à disposition pour montrer sa technologie.

La version web de HuggingChat utilise un grand modèle de langage (LLM) appelé OpenAssistant, qui est également disponible sur Github. Il s’avère qu’il y a tout un tas de LLM disponibles sur Github, nous y reviendrons.

Comme pour ChatGPT et ses semblables, vous posez des questions à HuggingChat et il y répond. Contrairement à ChatGPT, il y a un petit bouton juste au-dessus du champ de requête qui dit « Rechercher sur le web », ce qui signifie que HuggingChat peut accéder au web pour faire ses recherches. Par exemple, lorsque j’ai désactivé le bouton « Rechercher sur le web », j’ai demandé : « Pourquoi le submersible Titan a-t-il coulé ? » j’ai reçu la réponse suivante :

Je m’excuse, mais sans contexte supplémentaire, il m’est difficile de déterminer à quel submersible Titan vous faites référence.

Mais lorsque j’ai activé la fonction « Recherche sur le web » et posé la même question, j’ai obtenu la réponse suivante :

Sans plus d’informations, il m’est difficile de dire avec certitude pourquoi il aurait implosé pendant les opérations liées à la récupération de l’épave du RMS Titanic au large de la côte est de l’Amérique du Nord (42°N 49°W / #TitanRover1).

Comme le naufrage du submersible est une histoire très récente au moment où j’écris cet article, cela montre que le LLM pré-construit n’a pas de données sur ce grand sujet d’actualité. Cependant, en choisissant d’inclure des données de recherche sur le web, vous pouvez asisster les résultats du chatbot.

Reste que vous n’utiliserez probablement pas HuggingChat au lieu de ChatGPT, Bard ou Bing. Les réponses ne sont pas toujours complètes. Elles se terminent parfois au milieu d’une phrase, et « continuer » ne les ramène pas sur la bonne voie. La plupart des réponses ne sont pas formatées et se présentent sous la forme d’un gros paragraphe. La réactivité est assez lente par rapport à ChatGPT. Parfois, les réponses n’ont pas grand-chose à voir avec la question.

Pour être honnête, la version web de HuggingChat est une version très précoce et est destinée à la démonstration des fonctionnalités du logiciel lui-même. Vous n’allez donc pas l’utiliser pour tricher sur vos devoirs. Vous l’utiliserez plutôt pour bricoler vos propres projets d’intelligence artificielle.

C’est ce que nous allons voir maintenant.

Construire son propre chatbot

Si vous êtes un vrai geek, vous pouvez construire votre propre chatbot en utilisant HuggingChat et quelques autres outils. Pour être clair, HuggingChat lui-même est simplement la partie interface utilisateur d’un chatbot plus global. Il ne contient pas l’intelligence artificielle ni les données. Il se contente d’introduire la question dans GPT et d’afficher les réponses.

Vous aurez également besoin d’un modèle linguistique. OpenAssistant est l’un de ces modèles de langage, qui peut être entraîné sur des ensembles de données.

C’est là que HuggingChat s’avère particulièrement intéressant pour les spécialistes de l’IA. Vous pouvez utiliser des LLM open-source, entraînés sur des ensembles de données open-source, pour alimenter votre propre chatbot.

Poussée à l’extrême, une application possible de cette technologie pourrait être la construction d’un chatbot destiné à être utilisé au sein d’une entreprise. Il serait formé sur les données propriétaires de l’entreprise, le tout étant hébergé à l’intérieur du pare-feu de l’entreprise – sans jamais être accessible à l’internet.

En fait, en combinant HuggingChat, un serveur d’inférence et un LLM, vous pouvez faire fonctionner votre propre chatbot sur votre propre matériel, complètement isolé de l’internet.

Cette vidéo YouTube donne un tutoriel de base sur la façon de faire cela dans un conteneur. La vidéo montre également comment séparer la partie inférence du travail de la partie interface utilisateur, et comment héberger une partie localement et une partie dans le cloud. En gros, une fois que vous avez les informations sources avec lesquelles jouer, vous pouvez construire à peu près tout ce qui vous vient à l’esprit — et que votre matériel peut faire tourner.

Oui, cela nécessite un serveur imposant doté d’une puissance de GPU importante. Mais c’est un petit prix à payer pour avoir son propre chatbot.

Et cela est important. ChatGPT est un outil puissant, formé sur qui sait quelles données, exécutant qui sait quels algorithmes, et produisant des réponses basées sur qui sait quelles informations de source.

Si vous voulez quelque chose que vous contrôlez, vous pouvez utiliser HuggingChat pour construire un chatbot dont vous avez la visibilité sur tous les aspects de son fonctionnement. Vous pouvez choisir de rendre ce chatbot accessible en ligne à d’autres utilisateurs et d’assurer la transparence pour tous les utilisateurs. Vous pouvez aussi construire une unité spéciale verrouillée, cachée derrière un pare-feu et accessible uniquement à vos propres employés.

Avec HuggingChat, le choix vous appartient – et c’est cool.

Alors, pensez-vous construire votre propre chatbot ? Si vous le pouviez, l’entraîneriez-vous à partir de données spécifiques ? Puisque vous avez maintenant la liberté de créer un chatbot à votre image, que feriez-vous avec ce pouvoir ? Faites-le nous savoir dans les commentaires ci-dessous.

Source : « ZDNet.com »

/ Powercenter

5 dossiers IT à découvrir chaque mois

Comment les opérateurs télécoms accompagnent les entreprises dans leurs moments de vie ?
Cloud de confiance, sous le vernis, quelle réalité ?
La profonde numérisation de l'économie a pour corollaire la dématérialisation de l'informatique. Mais la montée en puissance du cloud computing provoque de plus en plus d'inquiétude quant à la nécéssaire maîtrise des entreprises sur leurs données.Jamais donc les questions de la confiance et de la souveraineté numérique n'ont été aussi cruciales pour les professionnels qu’en ce moment. Le point sur les enjeux, et les solutions.
Découvrir tous les dossiers
Connexion

Vous n’avez pas encore de compte ?

AUTOUR DE ZDNET
SERVICES
À PROPOS