La data est au centre de notre écosystème, sa qualité et sa quantité sont déterminantes pour débloquer tout le potentiel de tolk.ai — mais la tâche est chronophage. Selon une étude de Cloud Factory, la création et la labélisation de données représente jusqu’à 80% d’un projet Machine Learning.
Nous avons travaillé dur pour résoudre ce challenge qu’est l’acquisition de données labélisés pour nos modèles de compréhension de langage naturel.
Aujourd’hui, nous vous proposons l’état de l’art de la génération de texte en 1 clic dans votre écosystème tolk.ai: GPT Data Augmentation.
Le challenge des modèles apprenants
Comme vous le savez, la quantité, la qualité des données ainsi que le design du set de données sont les trois leviers clés pour améliorer les performances de nos modèles et l’expérience de nos utilisateurs finaux.
Le problème est que l’acquisition de données et leur labélisation peut être chronophage et coûteux, en particulier lorsque vous êtes encore en phase de démarrage.
Ce coût se répète tout au long de la vie de votre chatbot, lorsque vous ajoutez de nouvelles Q&A à un jeu de données mature: vous pouvez créer un écart de distribution qui peut affecter négativement les performances de votre assistant sur les questions moins matures.
Introducing GPT Data Augmentation pour tolk.ai
C’est là que GPT Data Augmentation entre en jeu.
Nous avons utilisé le dernier modèle OpenAI, derrière ChatGPT, pour créer des phrases d’entraînement synthétiques qui vous aideront à accélérer le lancement de votre chatbot et à atteindre des performances exceptionnelles dès la création de votre assistant.
De plus, lorsque vous ajoutez de nouvelles Q&A, GPT Data Augmentation vous permet de rattraper rapidement le retard sur les questions plus matures et d’offrir une expérience de qualité à vos utilisateurs dès le début.
Import and Play
Utiliser GPT Data Augmentation est simple. Il suffit d’importer vos questions et réponses sur l’interface bot en un simple clic puis cliquer sur “Update”. tolk.ai se chargera de générer des phrases d’entraînement synthétiques qui vous permettront d’améliorer rapidement les performances de vos modèles. Vous pourrez les consulter directement depuis l’entraînement des différentes Q&A les moins entraînées de votre assistant.
GPT Data Augmentation pour tolk.ai Bot est disponible dès maintenant pour tout nos utilisateurs, en bêta gratuite.
Je suis persuadé que vous allez adorer cette nouvelle fonctionnalité et je suis impatient de vous entendre parler de vos résultats. N’hésitez pas à nous faire part de vos retours et à nous contacter si vous avez des questions ou des suggestions !