--- title: L'API Web Speech slug: Web/API/Web_Speech_API tags: - API - API Web Speech - Experimental - reconnaissance vocale - synthèse vocale translation_of: Web/API/Web_Speech_API ---

L'API Web Speech permet d'intégrer des données liées à la voix dans des applications web. L'API Web Speech se compose de deux parties : SpeechSynthesis (synthèse vocale) et SpeechRecognition (reconnaissance vocale asynchrone).

Concepts et usages de l'API Web Speech

L'API Web Speech rend les applications web capables de manipuler des données liées à la voix. Cette API se compose de deux parties :

La reconnaissance vocale (Speech recognition) est accessible via l'interface {{domxref("SpeechRecognition")}} qui fournit la capacité de reconnaitre la voix dans une source audio (normalement grâce à l'outil par défaut de reconnaissance vocale de l'appareil) et de réagir de façon pertinente. En général, on utilisera le constructeur de l'interface pour créer un nouvel objet {{domxref("SpeechRecognition")}} qui a un nombre de gestionnaires d'événements disponibles pour détecter lorsque de la parole arrive dans le micro de l'appareil. L'interface {{domxref("SpeechGrammar")}} représente un conteneur pour une série de règles de grammaire que votre application devrait reconnaître. La grammaire est définie en utilisant JSpeech Grammar Format (JSGF).
La synthèse vocale (Speech synthesis) est disponible via l'interface {{domxref("SpeechSynthesis")}}, un composant qui permet aux programmes de vocaliser leur contenu textuel (normalement grâce au synthétiseur vocal par défaut de l'appareil). Differents types de voix sont disponibles dans les objets {{domxref("SpeechSynthesisVoice")}}, et les différentes parties de texte à vocaliser sont interprétés par les objets {{domxref("SpeechSynthesisUtterance")}}. On peut les faire vocaliser en les passant à la méthode {{domxref("SpeechSynthesis.speak()")}}.

Pour plus de détails concernant ces fonctionnalités, voir Using the Web Speech API.

Les interfaces de l'API Web Speech

Le reconnaissance vocale

{{domxref("SpeechRecognition")}}: L'interface de contrôle de l'outil de reconnaissance; elle traite aussi le {{domxref("SpeechRecognitionEvent")}} reçu de l'outil de reconnaissance.
{{domxref("SpeechRecognitionAlternative")}}: Représente un mot unique qui a été reconnu par l'outil de reconnaissane vocale.
{{domxref("SpeechRecognitionError")}}: Répresente les messages d'erreur de l'outil de reconnaissance vocale.
{{domxref("SpeechRecognitionEvent")}}: L'objet événement pour les événements {{event("result")}} et {{event("nomatch")}}, et contient toutes les données associées avec un résultat de reconnaissance vocale intermédiaire ou définitif.
{{domxref("SpeechGrammar")}}: Les mots ou schémas de mots que l'on demande à l'outil de reconnaissance vocale de reconnaître.
{{domxref("SpeechGrammarList")}}: Répresente une liste des objets {{domxref("SpeechGrammar")}}.
{{domxref("SpeechRecognitionResult")}}: Répresente une unique reconnaissance réussie, qui peut contenir plusieurs objets {{domxref("SpeechRecognitionAlternative")}}.
{{domxref("SpeechRecognitionResultList")}}: Répresente une liste d'objets {{domxref("SpeechRecognitionResult")}}, ou bien un seul si les résultats sont récupérés en mode {{domxref("SpeechRecognition.continuous","continuous")}}.

La synthèse vocale

{{domxref("SpeechSynthesis")}}: L'interface de contrôle de l'outil de vocalisation; elle peut être utiliser pour rechercher des informations concernant les voix de synthèse disponible dans l'appareil, le démarrage et l'interruption de la vocalisation, et les commandes complémentaires.
{{domxref("SpeechSynthesisErrorEvent")}}: Contient les informations concernant toutes les erreurs qui se produisent pendant le traitement des objets {{domxref("SpeechSynthesisUtterance")}} dans l'outil de synthèse vocale.
{{domxref("SpeechSynthesisEvent")}}: Contient les informations concernant l'état actuel des objets {{domxref("SpeechSynthesisUtterance")}} qui ont été traités par l'outil de synthèse vocale.
{{domxref("SpeechSynthesisUtterance")}}: Répresente une requête de synthèse vocale. Il contient le contenu que l'outil de synthèse vocale devrait vocaliser et les informations sur comment le vocaliser (e.g. langue, ton et volume).

{{domxref("SpeechSynthesisVoice")}}: Représente une voix qui est supportée par le système. Chaque SpeechSynthesisVoice a son propre outil de synthèse vocale incluant les informations concernant la langue, le nom et l'URI.
{{domxref("Window.speechSynthesis")}}: Spécifiée comme une partie de l'interface [NoInterfaceObject] intitulée SpeechSynthesisGetter, et implémentée par l'objet Window, la propriété speechSynthesis fournit l'accès au controleur {{domxref("SpeechSynthesis")}}, et de ce fait un point d'entrée à la fonctionnalité de synthèse vocale.

Exemples

Le Web Speech API repo sur GitHub contient des démos qui illustrent la reconnaissance vocale et la synthèse vocale.

Spécifications

Spécification	État	Commentaire
{{SpecName('Web Speech API')}}	{{Spec2('Web Speech API')}}	Définition initiale

Concepts et usages de l'API Web Speech

Les interfaces de l'API Web Speech

Le reconnaissance vocale

La synthèse vocale

Exemples

Spécifications

Compatibilité des navigateurs

`SpeechRecognition`

`SpeechSynthesis`

Voir aussi