wav相关内容

如何获取.wav文件格式的Numpy数组输出

我是新手,我正在尝试训练我的音频语音识别模型。我想读取一个.wav文件,并将该.wav文件输出到Numpy数组中。我如何才能做到这一点? 推荐答案 根据@marco的评论,您可以查看Scipy库,特别是scipy.io。 from scipy.io import wavfile 要读取您的文件(‘filename.wav’),只需执行 output = wavfile. ..
发布时间:2022-06-07 21:44:27 Python

读取WAV文件并计算RMS

所以我正在尝试测试一些分析一些PCM数据量的代码。我得到了一些奇怪的音量测量数据,这与我从Audity获得的数据毫无意义。我的尺码好像到处都是。 我不确定我的错误是在读取WAV数据的方式中出错,还是在计算音量的方式中出错。 这里是我以字节形式读取数据并将其转换为短码的地方,因为它是PCM 16位。 InputStream pcmStream = this.getC ..
发布时间:2022-06-07 21:40:21 Java开发

如何在.wav文件中找到特定声音的时间戳?

我有一个.wav文件,我录制了自己的声音并讲了几分钟。比方说,我想找到我在音频中提到的确切时间。我研究了语音识别,并用Google Speech API进行了一些测试,但我得到的时间戳远远不准确。 作为另一种选择,我录制了一个非常短的.wav文件,我刚才说了&Mike";。我正在尝试比较这两个.wav文件,找出在较长的.wav文件中提到的每个时间戳。我遇到了令人惊叹的SleuthEy ..
发布时间:2022-06-07 21:28:36 Python

如何降低WAV码流的音量?

我有一份FLAC文件。我想通过“flac-dc”命令将其解码,读取该命令输出的WAV流,将音量减半,然后将信号输出回来。以下是我的实际代码: #include #include int main( int argc, char *argv[] ) { FILE *stream; int16_t normal, decreased; ..
发布时间:2022-06-07 21:16:44 其他开发

不能将音频文件编码为Base64吗?

目标:对话流语音机器人Api 我需要向对话流Api发送一个wav文件,并且格式和设置是预定义的。 所以我用AVAudioRecorder录制了.wav格式的音频 以下设置 audioFilename = getDocumentsDirectory().appendingPathComponent("input.wav") let settings: [String: Any] = ..
发布时间:2022-06-07 21:08:39 移动开发

正在从Web下载已使用wavelesurfer.js修改的音频

我已经创建了一个多音轨Web播放器,它使用wavelesurfer.js可以调整不同音轨的级别和平移。 我要做的是将具有新级别和平移的混合曲目导出为单个.wav文件。 我对此做了一些研究,很多人都指向https://github.com/mattdiamond/Recorderjs,但开发在4年多前就停止了,从我发现它似乎有很多问题。 仅按如下方式进行初始化:var rec = ..
发布时间:2022-06-07 20:58:10 前端开发

Wave.Error:UNKNOWN FORMAT:3尝试将WAV文件转换为Python中的文本时出现错误

我需要从麦克风录制音频并将其转换为文本。我用从网上下载的几个音频片段尝试了这个转换过程,效果很好。但当我尝试转换从麦克风录制的音频剪辑时,出现以下错误。 回溯(最近一次调用): 文件“C:UsersHPAppDataLocalProgramsPythonPython37libsite-packagesspeech_recognition__init__.py”,第203行,在中输入 Self.A ..
发布时间:2022-06-07 20:53:19 Python

使用PyAudio进行流媒体播放时修改音量

我正在尝试流式传输.WAV文件,同时去除其中一个声道,以便它只在一个扬声器上播放,同时降低音量。 我使用PyAudio的原因是我必须能够 一次传输多个文件 播放特定扬声器的声音(左/右) 中断播放声音文件 并且找不到允许这些功能的任何其他Python库。 我有以下代码,修改自PyAudio的流示例。它从一个扬声器播放WAV文件,但我无法找到以任何方式修改音量的方法。 ..
发布时间:2022-06-07 20:43:00 Python

音频可以通过FD送入耳机

我正在尝试使用12位分辨率的ADC录制音频,获取样本缓冲区并通过CAN FD将其发送到另一个设备,该设备获取该音频的样本并创建.wav并播放它。问题是,我看到麦克风的数据通过CAN FD发送到另一台设备,但我无法将这些数据正确地转换为.wav文件,并通过麦克风听到我说的话。我只听到哔声。 我正在创建新的.wav每4个CAN FD消息,以便进行某种实时通信并减少延迟,但我认为这是不可能的,或者 ..
发布时间:2022-04-10 17:44:03 其他开发

Python:实时或从WAV文件获取音量分贝级别

对于项目工作,我需要通过录制的音频文件或使用麦克风实时录制来测量音量。经过初步研究,我尝试使用声音文件库。使用soundfile读取该文件,并使用20*np.log10(np.sqrt(np.mean(np.absolute(a)**2)))计算了dB值。我得到了声音文件的负值。但是正常的声音可能在50-70分贝的范围内,我得到的是负值。有人能帮我解决这个问题吗? 推荐答案 简答:db ..
发布时间:2022-03-28 15:03:27 Python

如何在没有音频库的情况下编辑原始 PCM 音频数据?

我对精确提取 PCM WAV 文件的各个部分感兴趣,直到样本级别.大多数音频模块似乎都依赖于特定于平台的音频库.我想做这个跨平台,速度不是问题,有没有原生的python音频模块可以做到这一点? 如果没有,我将不得不解释 PCM 二进制文件.虽然我确信我可以相当容易地挖掘 PCM 规范,并且原始格式很容易理解,但我以前从未真正用 Python 处理过二进制数据.有没有很好的资源可以解释如何做到 ..
发布时间:2022-01-09 19:38:30 Python

如何通过 javascript/html5 播放 wav 音频字节数组?

我使用以下方法播放包含 wav 数据的字节数组.正在从 GWT 项目调用该函数. 此功能播放声音,但听起来像是某种地狱怪物.采样率绝对正确(声音是由 Neospeech 生成的),我尝试了 numberOfSamples 的各种值,这似乎只是表示音频数据的长度. numberOfSamples 大于 30000 的值将播放音频文件的全长,但它是乱码和可怕的. 那么,我做错了什么? ..
发布时间:2021-12-28 21:25:11 前端开发

C#中.wav的平均振幅

有谁知道使用 C# 获取 .wav 文件的平均振幅的方法(即使这意味着调用外部命令行程序并解析输出)?谢谢! 解决方案 这是一个片段,它读取立体声 wav 并将数据放入两个数组中.它未经测试,因为我不得不删除一些代码(转换为单声道并计算移动平均值) //////读入wav文件并放入Left和right数组//////priva ..
发布时间:2021-12-21 00:07:29 C#/.NET

java中mp3到wav的转换

我将 mp3 转换为 wav 的代码是: 包audio1;导入 java.io.File;导入 javax.sound.sampled.AudioFileFormat;导入 javax.sound.sampled.AudioFormat;导入 javax.sound.sampled.AudioInputStream;导入 javax.sound.sampled.AudioSystem;公共类新类 ..
发布时间:2021-12-21 00:03:44 Java开发

在没有临时文件的 Java 中将音频流转换为 WAV 字节数组

给定一个名为 in 的 InputStream,其中包含压缩格式(例如 MP3 或 OGG)的音频数据,我希望创建一个 byte 包含输入数据的 WAV 转换的数组.不幸的是,如果您尝试这样做,JavaSound 会给您以下错误: java.io.IOException:未指定流长度 我设法通过将 wav 写入临时文件,然后将其读回来使其工作,如下所示: AudioInputStream s ..
发布时间:2021-12-20 23:59:57 Java开发

下采样 wav 音频文件

我必须在不使用任何外部 Python 库的情况下将 wav 文件从 44100Hz 下采样到 16000Hz,所以最好是 wave 和/或 audioop.我尝试使用 setframerate 函数将 wav 文件的帧速率更改为 16000,但这只会减慢整个录制的速度.如何将音频文件下采样到 16kHz 并保持音频的相同长度? 解决方案 可以使用Librosa的load()函数, 导入 ..
发布时间:2021-12-20 23:58:04 Python

RIFF WAV 文件中是否保证格式参数的字节序?

在 RIFF WAV 文件中是否保证格式参数的字节序?我听到了相互矛盾的答案,包括对RIFX 文件格式. 解决方案 是. 如果文件以 RIFF 开头,则它是小端.如果它以 FFIR 或 RIFX 开头,则可能不是.一般来说,支持 WAV 格式就意味着支持 RIFF 文件,尽管添加 RIFX 支持应该不难. BWF(广播波格式)的 AES31 规范引用了这个 RIFF 规范:ht ..
发布时间:2021-12-20 23:51:24 其他开发