在Javascript应用程序中执行语音识别-编程学习网

语音识别是计算机科学和计算语言学的一个跨学科子领域。它可以识别口语并将其翻译成文本，它也被称为自动语音识别（ASR），计算机语音识别或语音转文本（STT）。

机器学习（ML）是人工智能（AI）的一种应用，它使系统能够自动学习并从经验中进行改进，而无需进行明确的编程。机器学习在本世纪提供了大多数语音识别方面的突破。如今，语音识别技术无处不在，例如Apple Siri，Amazon Echo和Google Nest。

语音识别以及语音响应（也称为语音合成或文本到语音（TTS））由Web speech API提供支持。

在本文中，我们重点介绍JavaScript应用程序中的语音识别。另一篇文章介绍了语音合成。

语音识别接口

SpeechRecognition 是识别服务的控制器接口，在Chrome中称为 webkitSpeechRecognition。SpeechRecognition 处理从识别服务发送的 SpeechRecognitionEvent。SpeechRecognitionEvent.results 返回一个SpeechRecognitionResultList 对象，该对象表示当前会话的所有语音识别结果。

可以使用以下几行代码来初始化 SpeechRecognition：

// 创建一个SpeechRecognition对象 
const recognition = new webkitSpeechRecognition(); 
 
// 配置设置以使每次识别都返回连续结果 
recognition.continuous = true; 
 
// 配置应返回临时结果的设置 
recognition.interimResults = true; 
 
// 正确识别单词或短语时的事件处理程序 
recognition.onresult = function (event) { 
  console.log(event.results); 
};

ognition.start() 开始语音识别，而 ognition.stop() 停止语音识别，它也可以中止（ recognition.abort）。

当页面正在访问您的麦克风时，地址栏中将显示一个麦克风图标，以显示该麦克风已打开并且正在运行。

我们用句子对页面说。“hello comma I'm talking period.” onresult 在我们说话时显示所有临时结果。

这是此示例的HTML代码：

 
"en"> 
   
    "UTF-8" /> 
    name="viewport" content="width=device-width, initial-scale=1.0" /> 
    Speech Recognition 
     
     
   
   
    "button">Press to Start 
    "content">

第25行创建了 SpeechRecognition 对象，第26和27行配置了 SpeechRecognition 对象。

当一个单词或短语被正确识别时，第28-34行设置一个事件处理程序。

在第12行，单击该按钮后，它可能仍会打印出一些消息。这是因为 Recognition.stop() 尝试返回到目前为止捕获的SpeechRecognitionResult。如果您希望它完全停止，请改用 ognition.abort()。

您会看到动画按钮的代码（第38-51行）比语音识别代码长。这是该示例的视频剪辑：https://youtu.be/5V3bb5YOnj0

网络语音识别依赖于浏览器自己的语音识别引擎。在Chrome中，此引擎在云中执行识别。因此，它仅可在线运行。

语音识别库

有一些开源语音识别库，以下是基于npm趋势的这些库的列表：

Annyang是一个JavaScript语音识别库，用于通过语音命令控制网站。它建立在SpeechRecognition Web API之上。在下一节中，我们将举例说明annyang的工作原理。

artyom.js是一个JavaScript语音识别和语音合成库。它建立在Web语音API的基础上，除语音命令外，它还提供语音响应。

Mumble是一个JavaScript语音识别库，用于通过语音命令控制网站。它建立在SpeechRecognition Web API之上，这类似于annyang的工作方式。

Julius是面向语音相关研究人员和开发人员的高性能，占用空间小的大词汇量连续语音识别（LVCSR）解码器软件。它可以在从微型计算机到云服务器的各种计算机和设备上执行实时解码。Julis是使用C语言构建的，而julius.js是Julius自以为是JavaScript的移植版。

voice-commands.js是一个JavaScript语音识别库，用于通过语音命令控制网站。它建立在SpeechRecognition Web API之上，这类似于annyang的工作方式。

var SpeechRecognition = root.SpeechRecognition || root.webkitSpeechRecognition || root.mozSpeechRecognition || root.msSpeechRecognition || root.oSpeechRecognition;

"en"> "UTF-8" /> name="viewport" content="width=device-width, initial-scale=1.0" /> Annyang "//cdnjs.cloudflare.com/ajax/libs/annyang/2.6.1/annyang.min.js"> "button">Press to Start "content">

文章详情

在Javascript应用程序中执行语音识别

语音识别接口

语音识别库

Annyang

结束

软考中级精品资料免费领

相关文章

猜你喜欢

在Javascript应用程序中执行语音识别

如何在Javascript应用程序中执行语音识别

JS应用程序中怎么执行语音识别

使用谷歌文档在 Ubuntu 中对文本进行语音识别

怎么在微信小程序中利用同声传译实现语音识别功能

利用SpringBoot和TensorFlow进行语音识别模型训练与应用

计算机能不能直接识别执行用汇编语言编写的程序

在 .NET 应用程序中运行 JavaScript，你会了吗？

大语言模型在应用协议识别中的应用

微信小程序使用同声传译实现语音识别功能

空白标识符在 Go 语言程序设计中的应用

如何在移动应用程序中集成面部识别技术

如何在 Go 语言中使用 JavaScript 实现实时应用程序？

行为序列模型在抖音风控中的应用

怎么在java中利用多线程执行多个程序

JavaScript JSON 与应用程序性能监控：识别和解决性能瓶颈

如何在pycharm中运行flask应用程序

如何将PHP应用程序打包成可执行文件并在Linux上运行？

PHP 开发者必知：如何在 Laravel 应用程序中实现 Shell 脚本的执行？

ChatGPT推出iPhone应用程序！可以语音输入提问，安卓版正在开发中