On entend souvent parler des mêmes modèles et use cases comme la génération de texte, le code, les chatbots, etc. Dans cette session, nous ferons un tour d'horizon de plusieurs plusieurs modèles Open Source disponibles sur Hugging Face mais un peu moins mis en lumière bien que très largement utilisés dans l'industrie. Tout cela articulé dans une démo d'un robot majordome, Alfred, dans une scène virtuelle sur Nvidia Isaac Sim.

Voici quelques catégories que nous allons aborder :

  • 📝 Natural Language Processing - mesurer la similarité, classer du texte, extraire du sens.
  • 📊 Tabular & Time Series - faire de la prédiction, de la régression, détecter des tendances.
  • 🔊 Audio - modifier un son, isoler des voix, extraire des représentations audio.
  • 👁️ Computer Vision - détecter des objets, segmenter des images, transformer des vidéos.
  • 🤖 Robotics - apprendre des gestes, exécuter des actions, contrôler un robot.

Le sujet est vaste… et devrait donner plusieurs idées de projets intéressants à développer 🤗