-
Notifications
You must be signed in to change notification settings - Fork 24
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
你好,请问在训练过程中是否采用了kaldi中加混响,加增噪音的数据增强手段? #1
Comments
没有做数据增广,有兴趣的话可以自己试一下,不过训练时间可能需要调整 |
最近注意到ECAPA-TDNN里面采用的数据增广效果还是很显著的,有兴趣可以试试。 |
您好,请问您有没有成功复现过ECAPA-TDNN?,我这边仅仅使用kaldi的数据增广方法,也没有使用s-norm,仅仅获得了1.35%EER。另外,您论文的第16个参考文献是否存在问题? |
|
学习率和原文一致,具体代码如下:
|
@qiny1012 我初步复现了一下ECAPA-TDNN,目前在使用Cosine的情况下,EER在1.5%左右。 和原论文的区别在于:
似乎某些增广数据对于性能有副作用(可能是MUSAN music,也可能是tempo的参数问题,原论文未给出明确值)。我准备调整训练数据之后再试试。 此外,我在同策略下训练了一个更快的模型(轻量化D-TDNN + Focus),结果和ECAPA-TDNN基本一致。 |
感谢您分享,是否可以将您的新论文(ICASPP2021)发给我看看,邮箱:qiny1012@qq.com,非常感谢。 |
请问您成功复现了ECAPA-TDNN了吗,我在使用MUSAN+RIR,fbank80维,使用z-norm的情况下EER结果为1.32%,如果您有成功复现ECAPA-TDNN,还望与您交流下心得,十分感谢🙏 |
建议重新用Vox2训练后在Vox1-E和Vox1-H上测试,精度足够高的情况下,Vox1-O的结果相对很不稳定。 |
D-TDNN + CAM (w/o data aug, 4M params)
|
感谢二位,我去用speechbrain试试 |
No description provided.
The text was updated successfully, but these errors were encountered: