Les meilleurs assistants vocaux Open Source | YourTechDiet

Beaucoup d'entre nous ont déjà entendu parler d'assistants vocaux tels qu'Alexa, Siri, Google Assistant et Cortana (et ont probablement entendu parler d'eux aussi).

Ces assistants vocaux sont essentiellement basés sur la reconnaissance vocale (bien sûr), le NLP et la synthèse de la parole.

Le marché mondial des assistants vocaux devrait connaître une croissance de 30 % entre 2018 (1,2 milliard de dollars) et 2024 (5,4 milliards de dollars).

Selon une récente enquête auprès des consommateurs, 87,7 millions d'adultes américains utilisaient des haut-parleurs intelligents en janvier 2020.

Au 3e trimestre 2019, Amazon était en tête du marché des enceintes intelligentes avec 10,4 millions d'unités, devant Alibaba (3,9 millions), Baidu (3,7 millions), Google (3,5 millions) et d'autres.

Face à l'essor de ce marché, un grand nombre d'entreprises s'empressent de l'intégrer à leurs activités.

Cette technologie n'étant pas encore totalement aboutie, il est plus judicieux pour les entreprises d'opter pour une solution d'assistant vocal qui peut être facilement personnalisée ou utilisée de manière ludique.

Un assistant vocal open-source est donc tout indiqué. Essayons de découvrir quelques-uns des meilleurs assistants vocaux open-source disponibles à ce jour.

Mycroft

Mycroft est probablement le plus populaire parmi toutes les options d'assistant vocal open-source et c'est aussi le premier à le faire. Mycroft a commencé sa campagne de produits avec Mark 1 en 2015 et a parcouru un long chemin depuis lors.

Voici comment démarrer avec Mark 1. Mark peut effectuer toutes les opérations rudimentaires, comme répondre à des questions factuelles, jouer de la musique pour vous ou vous permettre de contrôler facilement des appareils connectés en Wi-Fi.

Mycroft a même créé Mark 2, considéré comme un haut-parleur intelligent de nouvelle génération.

Prix : Le Mark 1 coûterait 149,99 $ et le Mark 2, pour l'instant, fait l'objet d'un petit dépôt de 1 $ pour la réservation. Il faudra attendre un peu pour la sortie en masse.

Assistant ouvert

Open Assistant est un prototype d'assistant vocal open-source. Ce qui fait d'Open Assistant une option d'assistant vocal d'autant plus attrayante, c'est qu'il garantit que vos commandes vocales sont limitées à l'appareil.

Open Assistant comprend trois éléments principaux : l'esprit d'amorçage, l'esprit de la racine et l'esprit de l'utilisateur.

L'esprit d'amorçage fonctionne comme une sorte de bouton d'alimentation. Ce composant est destiné à initialiser le système lorsque le mot déclencheur est prononcé et que l'esprit racine est ensuite activé.

L'esprit racine est le composant central de cette unité. Il aide l'appareil à répondre à un ensemble d'instructions vocales de base.

Vient enfin l'esprit de l'utilisateur, qui est le composant le plus avancé des trois et qui a la capacité d'apprendre et de se comporter d'une manière spécifique.

Prix : Il s'agit d'un logiciel gratuit.

Jasper

Shubhro Saha et Charlie Marsh sont les deux étudiants de l'université de Princeton qui ont développé cet assistant informatique vocal.

Jasper fonctionne avec un matériel très basique comprenant un microphone de base, un adaptateur réseau et un Raspberry Pi.

En ce qui concerne ses capacités, il effectue un ensemble d'opérations de base telles que la lecture de musique à partir de Spotify, la réponse à des questions rudimentaires telles que les mises à jour météorologiques ou le suivi des mises à jour des médias sociaux.

Prix : Il s'agit là encore d'un logiciel gratuit qui vous permet de concevoir des fonctionnalités selon votre choix.

LinTO

LinTO est une autre solution d'assistant vocal open-source. Ce projet est financé par le PIA (Programme d'investissements d'avenir) du gouvernement français.

Ce qui joue grandement en faveur de LinTO, c'est qu'il peut fonctionner en tant que SaaS et se déployer dans vos locaux.

Voici quelques-unes des principales caractéristiques de cette plateforme

  1. Mise à jour de la base de données avec le vocabulaire spécifique à l'entreprise.
  2. Il est doté d'une technologie de pointe qui minimise les erreurs de formulation.
  3. Bonne compréhension de l'intention du texte.

Prix : Ce système à code source ouvert est disponible sous la licence GNU Affero, sans frais supplémentaires ni modèle freemium.

Rhasspy

Cet assistant vocal open-source a été créé et est maintenu par Michael Hansen.

Rhasspy est conçu pour fonctionner sur différents types de matériel tels que -

  1. Raspberry Pi 2-3
  2. Ordinateur de bureau/portable/serveur
  3. Raspberry Pi Zero

Les principales fonctionnalités de Rhasspy comprennent la détection des mots de réveil, la transcription de la parole, la reconnaissance des intentions et la formation.

Prix : Cet assistant vocal open-source est disponible sous licence MIT.

Aimybox

Aimybox est un SDK d'assistant vocal open-source qui vous permet de créer votre propre assistant. Ce SDK open-source peut être utilisé à la fois pour Android et iOS.

Aimybox lui-même proclame que son architecture extensible est sa caractéristique la plus importante, ce qui le rend totalement libre pour toute transition de la parole au texte et du texte à la parole.

Aimybox se targue également de posséder des capacités permettant de surmonter les restrictions habituelles observées avec d'autres assistants vocaux.

Prix : Cet assistant vocal est disponible sous Apache 2.0.

Léon

Léon, l'assistant vocal a été développé par Louis Grenard. Cet assistant fonctionne sur des serveurs. Vous pouvez même parler avec cet assistant vocal installé sur votre système et même échanger des messages textuels.

Sa version 1.0.0-beta.2 a été lancée. Elle avait pour but d'améliorer les opérations de l'unité nationale de langues.

Prix : Cet assistant vocal open-source est disponible sous licence MIT.

Conclusion

Bon nombre de ces assistants vocaux à code source ouvert sont apparus assez récemment et il faudra probablement un certain temps pour qu'ils deviennent une solution plus sophistiquée.

Vous pouvez néanmoins opter pour l'un des assistants vocaux susmentionnés en fonction de vos besoins.