基于深度胶囊网络融合模型的多声音事件检测
传统的胶囊网络架构是基于动态路由机制实现的,需要大量迭代和向量计算来更新权值系数,并且胶囊之间不存在信息共享,导致信息冗余。针对这一缺陷,本工作提出了一种基于融合深度胶囊网络的多声音事件检测模型,在门控卷积和3D卷积下通过动态路由减少了特征重叠导致的信息冗余,并且对原始特征进行编码,将其用于特征信息补充,提高了训练次数模型的速度和准确性。本工作使用 …
qingzhou-jiang
传统的胶囊网络架构是基于动态路由机制实现的,需要大量迭代和向量计算来更新权值系数,并且胶囊之间不存在信息共享,导致信息冗余。针对这一缺陷,本工作提出了一种基于融合深度胶囊网络的多声音事件检测模型,在门控卷积和3D卷积下通过动态路由减少了特征重叠导致的信息冗余,并且对原始特征进行编码,将其用于特征信息补充,提高了训练次数模型的速度和准确性。本工作使用 …
声音事件检测是目前计算机听觉领域中的重要问题,而多声音事件检测是其中一个极具挑战性的研究热点。基于最新提出的非迭代的自注意力路由方法和胶囊网络,本文提出了一种基于自注意力路由的多路径胶囊网络模型,将其用于多声音事件检测。由于自注意力路由方法是非迭代且高度并行的,大大加快了模型的训练速度;多路径基础胶囊层使用不同大小的非对称卷积核,不仅使模型能获得不同分辨率的 …
作为一种新兴的网络结构,胶囊网络用向量输出替代标量输出,能够捕捉图像特征之间的空间关系,改善卷积神经网络的局限性。首先对胶囊网络进行训练实现图像分类,得到图像的预测类标签,判定出查询图像的所属类别,然后将网络的数字胶囊层中的特征参数作为图像的特征向量,在查询图像的所属类别集合中利用图像特征向量找到与查询图像相似的图像。分别在FASHION-MNIST和 …