wav相关内容

将大量数据从NIST更改为RIFF WAV文件

因此,我正在编写语音识别程序.为此,我从TIMIT下载了400MB的数据.当我准备读取wav文件时(我尝试了两个库),如下所示: import scipy.io.wavfile as wavfile import wave (fs, x) = wavfile.read('../data/TIMIT/TRAIN/DR1/FCJF0/SA1.WAV') w = wave.open('../da ..
发布时间:2020-09-13 22:31:12 其他开发

覆盖PCM 16bit LE到WAV

我正在尝试用C语言编写一个程序,将捕获的原始16kHz PCM 16位文件转换为 16位WAV . 我已经阅读了一些帖子,有人建议使用libsox.安装了它,现在我真的很难理解手册页. 到目前为止(通过阅读源dist中的示例),我发现structs: sox_format_t sox_signalinfo_t 可能用于描述我输入的数据.我还知道(如果有必要)我正在处理(时 ..
发布时间:2020-09-13 22:31:02 其他开发

增加/减少WAV文件Python的播放速度

我想使用python wave模块更改某个WAV音频文件的播放速度(增加或减少). 我尝试了以下事情: 读取输入文件的帧频. 将帧频提高一倍. 使用output_wave.setparams()函数编写一个具有提高的帧速率的新wave文件. 但无法解决问题. 请提出建议. 预先感谢 解决方案 哇! 如果在增加或减小速度时不必更改音高,则只需更改采样率 ..
发布时间:2020-09-13 22:29:51 Python

在给定时间查找.wav的“音量"

我正在为我的第四年项目开发一个小示例应用程序(处理功能响应式编程).这个想法是创建一个简单的程序,该程序可以播放.wav文件,然后显示正在播放的歌曲当前音量的“弹跳"动画(例如在录音软件中).我正在Scala中构建它,因此主要是在研究Java库和现有的解决方案. 目前,我已经设法轻松播放.wav文件,但似乎无法实现第二个目标.基本上有一种方法可以解码.wav文件,以便我可以通过某种方式访问 ..
发布时间:2020-09-13 22:27:06 Java开发

如何将提示/标记写入.NET中的WAV文件

我想使用C#将提示(即基于时间的标记,而不是类似ID3的标记)写入WAV文件.似乎免费的.NET音频库(例如NAudio和Bass.NET)不支持此功能. 我已经找到了 Cue工具的来源,但是它完全没有文档记录,而且相对复杂.有其他选择吗? 解决方案 以下是一个链接,解释了WAV文件中cue块的格式: http://www.sonicspot.com/guide/wavefil ..
发布时间:2020-09-13 22:13:02 C#/.NET

librosa无法打开librosa创建的.wav?

我正在尝试使用librosa通过从60秒持续时间的某些.wav文件中剪切1s片段来生成一些数据. 这部分有效,我创建了所有文件,也可以通过任何播放器收听它们,但是如果我尝试使用librosa.load打开它们,则会收到此错误: >>> librosa.load('.\\train\\audio\\silence\\0doing_the_dishes.wav', sr=None) Tra ..
发布时间:2020-09-13 22:11:09 Python

ffmpeg-制作干净的WAV文件

我希望使用ffmpeg将一个名为Star Wars: Jedi Knight: Dark Forces II的游戏批量转换为音频文件.我遇到的问题是ffmpeg似乎正在执行某些操作,因此Jedi Knight无法播放声音文件. Jedi Knight接受从5khz到96khz,8位和16位,单声道和立体声的各种范围的普通PCM WAV文件.这听起来很简单.除非使用MS Sound Recor ..
发布时间:2020-09-13 21:58:37 其他开发

将mp4声音转换为python中的文本

我想将录音从Facebook Messenger转换为文本. 这是使用Facebook的API发送的.mp4文件的示例: 因此,此文件仅包含音频(不包括视频),我想将其转换为文本. 此外,我想尽快执行此操作,因为我将在几乎实时的应用程序中使用生成的文本(即用户发送.mp4文件,脚本将其转换为文本并显示回去). 我找到了这个示例 https://github.com/Uberi/s ..
发布时间:2020-09-13 21:53:50 Python

读取.wav文件时返回的数据到底是什么?

使用 之类的文件读取音频文件时 rate, wavData = scipy.io.wavfile.read('test.wav') wavData中的数据究竟代表什么? 解决方案 wavData是一个数字数组,每个数字代表一个音频信号样本.样本是时间间隔均匀分布的音频振幅的快照.因此,如果您返回的速率为48000,则wavData的前48000个元素将是价值1秒钟的音频信号.有关更 ..
发布时间:2020-09-13 21:39:01 Python

在python中从TIMIT数据库读取WAV文件

我正在尝试从python的TIMIT数据库读取wav文件,但出现错误: 当我使用wave时: wave.Error: file does not start with RIFF id 当我使用scipy时: ValueError: File format b'NIST'... not understood. 当我使用librosa时,程序卡住了. 我尝试使用sox将其转换 ..
发布时间:2020-09-13 21:35:03 Python

scipy.io.wavfile.read无法读取24位.wav文件

似乎scipy.io.wavfile.read无法读取24位.wav文件. 您对如何处理它们有想法吗? 解决方案 此处是scipy.io.wavfile的更新版本,其中添加了许多内容: 24位.wav文件支持读/写, 访问提示标记, 提示标记标签, 其他一些元数据,例如音高(如果已定义)等. wavfile.py(增强) 随时分享! ..
发布时间:2020-09-13 21:28:02 Python

尝试获取Python中.wav文件的频率

我知道有关Python中.wav文件的问题已被殴打致死,但由于没有人的答案似乎对我有用,我感到非常沮丧.我想做的事情对我来说似乎相对简单:我想确切地知道在给定时间.wav文件中的频率.我想知道,例如,“从时间 n 毫秒到 n + 10 毫秒,声音的平均频率为 x 赫兹".我见过一些人在谈论傅立叶变换和Goertzel算法以及各种模块,但我似乎无法弄清楚如何去完成我所描述的事情.我尝试查找诸如“在p ..
发布时间:2020-09-13 21:26:58 Python

为内存中的流创建有效的wav文件头

我将原始无头 wav 音频数据作为MemoryStream. Stream rawAudioStream = Producer.GetRawAudioFileStream(...); 我知道这些流的数据格式: // WaveFormat(int rate, int bits, int channels); WaveFormat waveformat = new WaveFormat ..
发布时间:2020-09-13 21:22:21 C#/.NET

使用python过滤WAV文件

因此,我最近成功构建了一个系统,该系统将完全使用python记录,绘制和播放音频wav文件.现在,我尝试在录制和开始绘制文件并将其输出到扬声器之间进行一些过滤和音频混合.但是,我不知道从哪里开始.现在,我要读取一个初始wav文件,应用一个低通滤波器,然后将新过滤的数据重新打包到一个新的wav文件中.这是我记录初始数据后用来绘制初始数据的代码. import matplotlib.pyplot ..
发布时间:2020-09-13 21:13:22 Python

如何以编程方式将2个或更多.WAV文件连接在一起?

我需要能够将2个或多个.wav文件合并到一个.wav文件中.我必须使用C#以编程方式进行此操作(不能选择第三方产品).我知道System.Media.SoundPlayer类,但我不想播放.wav,而只是创建它. 解决方案 这是使用 NAudio .这将确保仅连接数据块(与此CodeProject文章中的代码示例不同) 链接到另一个答案中).它还可以保护您,防止串联不共享相同格式的WAV文 ..
发布时间:2020-09-13 21:05:52 C#/.NET

在Matlab Coder中读取.wav文件

我想使用 matlab编码器读取音频文件.问题是不支持wavread(),但是由于这是任何音频编码中必不可少的一部分,因此我认为必须有另一种方法来实现这一目标? 有什么想法吗? 解决方案 您的用例是什么?如果您真的只想在MATLAB中的MEX函数中运行生成的代码,则可以使用coder.extrinsic调用wavread.在MATLAB环境之外无法正常工作. 在MATLAB环境之外, ..
发布时间:2020-08-10 23:07:42 其他开发

创建24位WAV文件有什么特别的事情吗?

我可以成功创建一个16位的wav文件,但是当创建一个24位的文件时,我听到的只是白噪声.我正在设置24位带符号整数数据块.我必须在wav文件头的字节20处设置一些特殊的音频格式吗?我当前正在使用格式1. 编辑#1 wBitsPerSample字段设置为24.wAvgBytesPerSec(字节速率)字段设置为 // 44100 * (2 * 3) sampleRate * blo ..
发布时间:2020-07-18 18:52:59 前端开发

无法将音频文件编码为Base64?

目标:对话流程语音Bot Api 我需要将wav文件发送到Dialog Flow Api,并且格式和设置是预定义的. 因此我使用.wav格式使用AVAudioRecorder录制了音频,使用 以下设置 audioFilename = getDocumentsDirectory().appendingPathComponent("input.wav") let settings: ..
发布时间:2020-07-14 00:45:07 其他开发