当前位置:网站首页>使用互相关进行音频对齐
使用互相关进行音频对齐
2022-07-31 16:04:00 【非典型废言】
在计算一些音频指标如SNR的时候,我们需要音频信号与参考信号对齐,但有时候我们处理后的或者录制的音频并不是与参考信号对齐的,这就需要找到一种方法将它们对齐。
I. 互相关函数
音频对齐可以转化为时延估计问题,我们以前有介绍过使用GCC-PHAT进行时延估计,这里我们采用一种更为简单的方式进行估计——互相关函数。我们在语音信号时域分析介绍过自相关函数,类似的对于离散时域信号互相关函数的计算公式为:
我们知道在频域互相关中我们对广义互相关进行了一个加权,PHAT起到了白化的结果使得其互相关函数峰值更加明显,类似的可以对公式(1)进行类似的操作来使得峰值更为明显:
互相关的计算其实和互相关类似,我找了个视频来解释这个计算过程。
II. Praat
很多编程语言都封装好了互相关函数,这里我们使用一个语音分析领域常用的软件叫Praat。由于语音长度是有限的Praat在互相关函数上进行了适当的修改,简单来说互相关序列的开始时间将是f 的开始时间减去g 的结束时间,结束时间将是f的结束时间减去g的开始时间,即第一个采样的时间是f 的第一个样本减去g的最后一个样本,最后一个样本的时间将是f的最后一个样本减去g 的第一个样本,自相关序列的长度是f和g的样本数之和减1。
我们下面来看下效果,首先我们有两个音频,如下图所示,可以明显看到两个轨道上的音频有明显的延迟。
我们通过Praat计算出两个音频的时间延迟大约是1.284s。
我们把第二个轨道的音频提前1.284s。
得到的结果如下,看起来两段音频基本对齐了。
本文相关代码,在公众号语音算法组菜单栏点击Code获取。
参考文献:
[1]. http://paulbourke.net/miscellaneous/correlate/
[2]. UCBS, Digital Speech Process
[3]. http://www.dsg-bielefeld.de/dsg_wp/wp-content/uploads/2014/10/video_syncing_fun.pdf
[4]. https://www.fon.hum.uva.nl/praat/manual/Sounds__Cross-correlate___.html
边栏推荐
- The use of border controls
- How Redis handles concurrent access
- JVM parameter analysis Xmx, Xms, Xmn, NewRatio, SurvivorRatio, PermSize, PrintGC "recommended collection"
- Insert into data table to insert data
- Summary of the implementation method of string inversion "recommended collection"
- ML.NET related resources
- Implement anti-shake and throttling functions
- 多主复制下处理写冲突(4)-多主复制拓扑
- 上传图片-微信小程序(那些年的坑记录2022.4)
- tensorflow2.0 cnn(layerwise)
猜你喜欢
腾讯云部署----DevOps
国内市场上的BI软件,到底有啥区别
leetcode303 Weekly Match Replay
How to switch remote server in gerrit
【7.29】代码源 - 【排列】【石子游戏 II】【Cow and Snacks】【最小生成数】【数列】
Getting Started with TextBlock Control Basic Tools Usage, Get Started
C程序是如何跑起来的01 —— 普通可执行文件的构成
[TypeScript] In-depth study of TypeScript type operations
tooltips使用教程(鼠标悬停时显示提示)
6-22 Vulnerability exploit - postgresql database password cracking
随机推荐
ML.NET相关资源整理
.NET 20th Anniversary Interview - Zhang Shanyou: How .NET technology empowers and changes the world
C语言”三子棋“升级版(模式选择+AI下棋)
软件实现AT命令操作过程
网站漏洞修复服务商关于越权漏洞分析
【7.28】代码源 - 【Fence Painting】【合适数对(数据加强版)】
C语言-函数
利用PHP开发具有注册、登陆、文件上传、发布动态功能的网站
Applicable scenario of multi-master replication (2) - client and collaborative editing that require offline operation
[7.28] Code Source - [Fence Painting] [Appropriate Pairs (Data Enhanced Version)]
C程序是如何跑起来的01 —— 普通可执行文件的构成
update data table update
单细胞测序流程(单细胞rna测序)
牛客 HJ3 明明的随机数
npm安装时卡在sill idealTree buildDeps,npm安装速度慢,npm安装卡在一个地方不动
.NET 20周年专访 - 张善友:.NET 技术是如何赋能并改变世界的
Delete the disk in good condition (recovery partition)
The new BMW 3 Series is on the market, with safety and comfort
BGP综合实验(建立对等体、路由反射器、联邦、路由宣告及聚合)
Kubernetes common commands