Vous voulez créer un projet de reconnaissance vocale, mais vous ne savez pas par où commencer ? Ne vous inquiétez pas, dans cet article, j’ai discuté des 20 meilleurs projets de reconnaissance vocale et de leurs liens sur GitHub.

Table des matières

Actualités Alan AI

Alan AI est un logiciel de reconnaissance vocale qui vous donne la permission d’ajouter des capacités vocales à vos applications. Vous serez en mesure de contrôler tout dans l’application en utilisant votre voix. Il est très facile à intégrer.

Reconnaissance vocale

Il s’agit d’un projet de reconnaissance du locuteur ou de reconnaissance de l’empreinte vocale. Il reconnaît automatiquement le locuteur sur la base des informations individuelles contenues dans les ondes vocales. Par conséquent, la voix du locuteur peut être utilisée pour vérifier l’identité et contrôler l’accès à des services tels que la messagerie vocale, les informations confidentielles, etc.

Détection de mots de réveil

Le système de détection des mots d’éveil est un développement futur qui devient populaire. Il permet de faciliter le multitâche. Apple, Microsoft et Amazon ont mis au point des moteurs de mots personnalisés qui utilisent des mots comme Siri, Cortana et Alexa. Ce projet se concentre uniquement sur la détection de la voix.

RFBD : saisie robotique œil-main

Ce projet représente un système de vision basé sur l’œil dans la main RGBD utilisé pour la reconnaissance vocale, la détection d’objets, la saisie robotique, l’estimation de pose et la segmentation. Il peut facilement faire de la reconnaissance vocale.

Reconnaissance vocale VHDL

Le système de reconnaissance vocale de ce projet est réalisé sur des cartes FPGA (BASYS2) en utilisant VHDL. Vous aurez besoin de 2 FPGA et de 2 cartes BASYS pour la mise en œuvre du projet car il nécessite de l’espace RAM et la capacité de traitement contourne les ressources de BASY2.

Traducteur en langue des signes indienne.

Ce projet prend votre voix comme entrée, la traite et la transforme en langage des signes indien qui peut être compris par ceux qui ne peuvent pas parler. De plus, il peut également reconnaître la langue des signes indienne et la transformer en texte pour ceux qui ne peuvent pas entendre mais savent lire.

Osky l’assistant vocal

Ce projet est un assistant vocal qui est construit en utilisant python, et il a incorporé la reconnaissance vocale, le navigateur web et les paquets smtplib. Il a des fonctionnalités telles que l’ouverture du LMS de l’université pour aider à jouer des chansons, l’envoi d’e-mails, l’ouverture de sites Web et la recherche sur Wikipedia.

Reconnaissance du genre

La reconnaissance du genre est un projet d’apprentissage automatique qui prédit le genre d’une personne après que vous ayez parlé, puis il analyse votre voix. Son ensemble de données provient de kaggle. Il utilise un SVM de base qui fournit une précision de 97,8 %.

Angular Evernote

Cette application utilise l’API d’Evernote, NodeJS, express JS et Gulp pour utiliser l’API d’Evernote avec l’API de reconnaissance vocale sur chrome qui capture les notes vocales, et ensuite elles sont stockées dans Evernote sous forme de texte.

Détection des points de terminaison vocaux

Ce projet fait partie de la reconnaissance vocale intelligente. Son objectif principal est de détecter les points de terminaison de la voix dans un fichier audio. Il est composé de deux tâches : la première est basée sur les caractéristiques du signal à court terme et un classificateur très simple, la seconde est basée sur les caractéristiques du domaine de fréquence et un classificateur de modèle statistique. Vous aurez besoin de Python 3.6+, tqdm et scikit-learn.

Traitement du signal numérique pour la classification de la reconnaissance vocale Le but de ce projet est d’entraîner un programme PC à être capable d’identifier la voix d’un locuteur. Pour l’utiliser, vous devez ;
Cloner ou télécharger le projet.
Exécuter le code & python by_awsome_program.py sur votre ligne de commande.
Choisir des modèles pour l’entraînement.
Sélectionner une référence et enfin cliquer sur le bouton predict, et vous allez voir dans la zone de résultat la prédiction.

Contrôleur vocal Rover

Ce rover est un contrôleur vocal et est construit sur raspberry Pi2 qui a Windows 10 iot core. La reconnaissance vocale est donnée par la reconnaissance vocale native de Windows API winrt dans le windows. Speech recognition namespace. Par défaut, il n’écoute que Hey, puis il se réveille et s’active pour permettre les commandes de déplacement en arrière ou en avant et de rotation. Vous pouvez également lui demander de se mettre en veille.

Robot à reconnaissance vocale

Ce projet utilise le logiciel Julius, I-Robot et la programmation C. Le logiciel Julius permet de donner des commandes vocales à votre PC ou ordinateur portable et via une commande de terminal qui se trouve dans le fichier Read.md dans la section du logiciel Julius où les commandes vocales peuvent être converties en texte dans un fichier qui est construit en temps réel en utilisant une certaine bibliothèque en C.

Alexa, un assistant vocal virtuel

Ce projet d’assistant vocal virtuel est créé à l’aide de Python. Il peut prendre des commandes vocales, les détecter et effectuer d’autres tâches telles que la diffusion de chansons sur YouTube et donner des réponses à diverses questions. La technologie de reconnaissance vocale Python et le convertisseur texte-parole ont été intégrés dans ce projet.

Sécurité domestique basée sur le mot de passe et la voix

Ce projet est un système de verrouillage de porte basé sur un mot de passe et une reconnaissance vocale manipulable par Bluetooth utilisant Arduino. Un code d’accès sécurisé sert de système de déverrouillage de la porte. En outre, il est possible de déverrouiller la porte à l’aide d’une application mobile contrôlée par Bluetooth.

Speech to Text

Pour développer ce projet, vous devez créer un moteur de conversion de la parole en texte en ligne. Le système va acquérir la parole au moment de l’exécution via le microphone et traiter l’échantillon de parole pour identifier le texte prononcé. Le texte sera ensuite stocké dans un fichier.

Assistant virtuel Golash Boy

Il s’agit d’un assistant de bureau basé sur Python qui aide à jouer de la musique, à envoyer des courriels, à ouvrir Google, Link in, GitHub et YouTube. Il peut rechercher n’importe quoi dans Wikipédia en utilisant des commandes vocales et peut faire des salutations correctement basées sur l’heure si c’est midi à 18h, il dit goof après-midi monsieur avez-vous déjeuné. Il peut envoyer des messages WhatsApp par commande vocale.

Wiki voice

Il s’agit d’un projet python qui utilise la bibliothèque de reconnaissance vocale de python pour effectuer l’interprétation de la voix en texte et également utiliser Beautiful soup pour rechercher la page Wikipedia de la recherche.

Emulation et jeu de reconnaissance vocale

Il s’agit d’un apprentissage automatique de la reconnaissance vocale à travers un simulateur Pokemon personnalisé et une application Nintendo Switch. Le but du projet est Fournir l’accessibilité dans les jeux et aider de nouvelles techniques pour le contrôle des jeux que la société peut utiliser pour améliorer la démographie des consommateurs et les achats.
Collecte de journaux de données pour l’amélioration du système pour la création de modes et de modèles d’entrée qui aideront à améliorer l’utilité et l’expérience de l’utilisateur.

Projet Dalle

Le robot Dalle peut être contrôlé à l’aide de commandes vocales, et il suit les ordres de ralentissement, d’accélération, de rotation, de pivotement et de rotation. Il dispose d’une webcam pour le contrôle gestuel et aussi l’enregistrement vidéo. Il dispose d’une commande d’urgence pour qu’il s’arrête s’il va trop loin.

Conclusion

Les projets ci-dessus sont les meilleurs projets de reconnaissance vocale que vous pouvez trouver sur GitHub. Il vous suffit de sélectionner celui qui vous intéresse et de cliquer sur le lien pour accéder au code sur GitHub.