Amazon Alexa认证的ESP AFE利用ESP32-S3的AI和DSP指令

Espressif ESP AFE

虽然大多数亚马逊Alexa认证的产品都是硬件设计,亚马逊网站还包括一个软件音频前端(AFE)开发工具包部分,列出了在嘈杂环境中优化音频检测的软件算法,最新添加的是Espressif的音频前端算法,或简称ESP AFE,最近才有资格使用亚马逊Alexa设备。这不是Espressif Systems的第一个Alexa认证解决方案,该算法是由Espressif的AI实验室团队创建的,他们使用ESP32-S3处理器中的AI和DSP指令来优化代码。该算法只使用了12 - 20%的CPU,以及220 KB的内部内存和240 KB的外部内存,为在无线SoC中运行的其他应用程序留下了额外的资源。ESP AFE据说[…]

AudioMoth Dev是一款基于SiLabs EFM32单片机的全频谱声学开发板

AudioMoth Dev

AudioMoth是一种低成本、开源的声学监测设备,可以将每秒8000到384000个样本的未压缩音频记录到microSD卡上。与灵敏度能听得见的声音以及超声波频率范围,它主要是用于监测野生动物包括蝙蝠,蝉,热带雨林,等制造商,打开音响设备,现在提供开发板与AudioMoth Dev版本,基于硅实验室EFM32想知道壁虎单片机像完整的设备,价格为79.99美元+在GrougGets上发货。AudioMoth开发板规格:无线微控制器- Silicon Labs EFM32 Wonder Gecko Cortex-M4F MCU @ 48MHz 256kB Flash, 32kB RAM外部RAM - 256kB SRAM存储- MicroSD卡插槽音频捕获板上模拟MEMS麦克风,灵敏度-38 dBV/Pa, 63dba信噪比3.5 mm外置驻极体电容麦克风插孔(注:可选外壳不兼容时[…]

用于spike神经网络(SNN)的先天神经形态人工智能加速器使亚mw人工智能推理成为可能

先天神经形态人工智能加速器

目前,大多数人工智能加速器都依赖CNN(卷积神经网络)来执行人工智能推理,其速度和效率远超CPU内核,甚至gpu。但还有另一种类型的神经网络,即尖峰神经网络(SNN),它利用电信号尖峰的时间来执行模式识别任务,其方式类似于大脑中的神经元。在效率方面的声明是相当令人难以置信的,每瓦的性能是微处理器和数字加速计的1万倍,能量低500倍,延迟短100倍。有几家公司正在研究用于刺激神经网络的神经型人工智能加速器,其中最著名的是预言公司(prophet)专注于图像处理,而innate公司正在研究一种超低功耗的人工智能加速器,处理音频、健康和声音和语音识别雷达、生命体征监测、老年人跌倒传感器,最近,innate公司提供了关于[…]亚博体育官下载

谷歌发布了Lyra低比特率语音编解码器的源代码

莱拉源代码

谷歌在去年2月展示了Lyra音频编解码器,用于低3 kbps比特率的高质量语音通话。但在当时,我们只能用眼睛看,或者说是用耳朵听,因为该公司没有发布任何软件,只是与Speex @ 3kbps或Opus @ 6kbps相比质量卓越的音频样本。谷歌现在已经发布了Lyra源代码,它是用c++编写的,以获得最佳的速度、效率和互操作性,并同时依赖于Bazel构建框架和GoogleTest框架。beta版提供了Lyra编码和解码所需的工具和api,目前针对64位Arm Android平台进行了优化,但也可以在Linux x86 64位上运行。还有一个示例应用程序- lyra_android_example -集成了Android NDK,并提供了一个最小的GUI与两个按钮来记录[…]

Bluetrum AB32VG1板采用AB5301A蓝牙RISC-V单片机,运行RT-Thread实时操作系统

bluturm RISC-V板描述

Bluetrum是一家专注于音频芯片的深圳无晶圆厂公司,基于其AB5301A蓝牙RISC-V MCU设计了一款用于通用和音频应用的AB32VG1板。该板配有MicroSD卡,USB端口,3.5mm音频插孔,Arduino UNO兼容头,便于原型制作。Bluetrum AB32VG1板初步规范:MCU - Bluetrum AB5301A RISC-V MCU @ 120 MHz(可overclockable to 192 MHz) with 192KB RAM, 1MB flash,蓝牙5.0连接和FM收音机;LQFP48包存储- MicroSD卡插槽音频3.5毫米音频杰克,3话筒头连接,蓝牙5.0 PCB天线USB - USB 2.0主机端口USB c型港口对权力和编程扩张——Arduino UNO头1 x I2C 6 x ADC, 6 x PWM Misc -红外接收器,3 x用户按钮,1 x重置按钮,RGB LED,功率LED,Power Supply - 5V through USB Type-C[…]

QuickLogic的可听参考设计使Alexa语音启动设备

使用QuickLogic的智能可听参考设计

去年我们看到QuickFeather板采用EOS S3 Cortex-M4F MCU和嵌入式FPGA,这是一个众筹项目。今年,该公司推出了基于QuickLogic类似处理器的智能可听参考设计。该设备是专门为“语音发起,免提,Alexa内置设备与近距离通话支持。”QuickLogic的智能可听参考设计基于该公司的开放可重构计算(QORC),它支持MCU和FPGA设备的完整开源开发选项集。它还构建在EOS S3语音处理器和QuickFeather开源开发工具包之上。这可以通过延长设备的电池寿命来增强用户体验。EOS S3 Arm Cortex- M4处理器采用低功率声音检测(LPSD)技术,配合DSP概念的TalkTo噪声抑制和波束形成技术,用于信号的定向传输。它还配备了Alexa Wake Word引擎技术,一个[…]

Lyra音频编解码器以3kbps的比特率实现高质量的语音通话

Lyra vs Opus vs Speex

我们经常写关于新的视频编解码器,如AV1亚博体育官下载或H.266,最近,我们介绍了AVIF图像格式,它提供了比WebP和JPEG更好的质量/压缩比,但也有关于音频编解码器的工作。值得注意的是,我们注意到Opus 1.2在2017年发布时提供了良好的语音质量,比特率低至12kbps, 2019年发布的Opus 1.3进一步改进了编解码器,仅以9kbps就可以实现高质量的语音。但谷歌AI最近推出了Lyra超低比特率编解码器,用于语音压缩,在比特率低至3kbps的情况下实现高语音质量。在我们讨论Lyra编解码器的细节之前,谷歌比较了一个参考音频文件,其中Lyra以3kbps编码,Opus以6kbps编码(Opus的最小比特率),Speex以3kbps编码,用户报告说Lyra的声音最好,接近原始。[...]

MaaXBoard Nano SBC采用NXP i.MX 8M Nano SoC实现音频和边缘物联网

MaaXBoard Nano南方浸信会

从2019年开始,Avnet通过其Embest子公司推出了几款基于NXP i.MX处理器的树莓pi启发的MaaXBoard sbc,该sbc采用的是NXP i.MX 8M处理器驱动的MaaXBoard单板计算机,随后将于2020年推出NXP i.x 8M Mini芯片的MaaXBoard Mini。最新型号是MaaXBoard Nano SBC,配备NXP i.MX 8M Nano四核Cortex-A53处理器,最适合音频和边缘物联网应用。MaaxBoard Nano SBC规格:SoC - NXP i.MX 8M Nano四核Arm Arm Cortex-A53处理器@ 1.5GHz with Cortex-M7F核@ 750MHz, 2D GPU, 3D GPU,但没有视频硬件解码。系统内存- 1gb DDR4 SDRAM存储- 16GB eMMC flash, 256mbit QSPI flash, MicroSD插槽显示接口- MIPI DSI显示接口音频- 3.5mm音频插孔,4x内置麦克风摄像头I/F - MIPI CSI摄像头接口网络-千兆以太网,802.11 b/g/n/ac WiFi 5,蓝牙4.2/5[…]