基于深度胶囊网络融合模型的多声音事件检测
2025年10月15日·
,·
0 分钟阅读时长
Qingzhou Jiang
杨树国
Wenwu Wang
摘要
传统的胶囊网络架构是基于动态路由机制实现的,需要大量迭代和向量计算来更新权值系数,并且胶囊之间不存在信息共享,导致信息冗余。针对这一缺陷,本工作提出了一种基于融合深度胶囊网络的多声音事件检测模型,在门控卷积和3D卷积下通过动态路由减少了特征重叠导致的信息冗余,并且对原始特征进行编码,将其用于特征信息补充,提高了训练次数模型的速度和准确性。本工作使用DCASE2017(Detection and Classification of Acoustic Scenes and Events 2017) Challenge Task 4数据集对模型进行评估,最终F1分数达到59.6%,声音事件检测错误率低至0.71。结果表明,所提出的方法可以显著提高训练速度和精度。
类型
出版物
青岛科技大学学报(自然科学版)
