告别繁琐!偏语言学专业的语音学实验入门与Praat长音频切分指南
针对语言学方向研究者,量身定制的语音实验完整工作流:从高保真录音、田野调查到长音频高效自动/人工标注
针对语言学方向研究者,量身定制的语音实验完整工作流:从高保真录音、田野调查到长音频高效自动/人工标注
户外田野录音、带背景音的播客、多人对话……当简单音量阈值失效时,VAD、降噪、ASR语义切分如何逐步升级
几行Python代码,按静音段自动检测切分,不会切断有效语音,批量处理一键完成
引题 我们在做音频标注的过程中,经常遇到需要批量修改某个地方,比如最开始标的发音aa,后来对数据整体的认识变了,想把所有的aa都变成读音ae;再比如,我们标注了所有的元音,辅音等,想利用节奏CV的计算方式,将所标的数据全部批量转化为C, V...
前言 引题 在语音处理过程中,整理语料,录音,再进行标注,是一个非常重要并且基础的步骤。有很多公司或者团队在录音的时候有专门写的软件,可以做到一次播放一句,然后录制完成,再点下一句,自动保存;但是,有一些工作受到条件限制,或者就是为了录制一...
引题 音频文件的重新采样,通常用于通过大规模语音数据构建模型时,由于算法的一些固有限制,采样率过高,意味着占有的内存,运算都会面临很大的挑战。因为现在数据规模动辄几个小时,甚至几十小时,上百小时。 一种方法可以使用C或者Python等编写程...
该项目包括以下内容: 1. Praat基本操作; 2. Praat对文件,包括标注文件TextGrid、音频文件wav的操作; 3. Praat对具体的标注信息的操作,比如tier, interval替换、增加、删除等操作; 4. 使用Pr...