NVIDIA – IA décodée : Qu’est-ce qu’un modèle de langage (LLM) ?

16 Mar 2024 | #HighTech

LLM

LLMs, Chatbots et RAGs, oh my ! Dans l’émission IA Decodée de cette semaine, NVIDIA explique aux lecteurs ce qu’est un grand modèle de langage (LLM), pourquoi ils sont importants et comment ils fonctionnent avec les Chatbots et les RAG sur les PC et stations de travail RTX.

Un chatbot, comme ChatGPT, est généralement la première interaction que la plupart des consommateurs ont avec un LLM, étant donné son interface conviviale et facile à utiliser. Si vous avez déjà utilisé ChatGPT ou d’autres services de chatbot, vous savez à quel point ils peuvent être pratiques au quotidien. Grâce à la puissance des GPU NVIDIA RTX, ces LLM peuvent également être suffisamment compacts pour fonctionner localement sur des PC ordinaires. Pour aller plus loin, lorsqu’ils sont associés à une technique appelée « retrieval-augmented generation » (RAG), les chatbots peuvent fournir des réponses plus intelligentes basées sur un ensemble de données spécifiques fournies par l’utilisateur, même avec ses propres données privées.

Chat with RTX est une démonstration technique qui utilise RAG pour exploiter un LLM. Elle permet aux utilisateurs de l’exécuter localement sur des PC et des stations de travail équipés de GPU NVIDIA RTX, et est accélérée par TensorRT-LLM pour des interactions et des requêtes plus rapides.

Nous espérons que le blog de cette semaine suscitera l’inspiration ou améliorera votre compréhension sur l’IA cette semaine.

Et si vous plongez dans le monde de l’IA, ne manquez pas la prochaine NVIDIA GTC, une conférence mondiale de développeurs d’IA qui se tiendra du 18 au 21 mars à San Jose (Californie) et en ligne. C’est l’occasion rêvée d’approfondir les dernières avancées et innovations.

SOURCE : COMMUNIQUE DE PRESSE – THE MESSENGERS

 

Facebooktwitterredditpinterestlinkedinmail