教育论文网

跨模态视频分类研究

论文目录
摘要第1-6页
abstract第6-7页
第一章 绪论第11-19页
    1.1 研究背景与意义第11-13页
    1.2 研究现状第13-16页
        1.2.1 国内研究现状第13-14页
        1.2.2 国外研究现状第14-16页
    1.3 研究目标与研究内容第16-17页
    1.4 主要贡献与创新第17页
    1.5 论文结构第17-19页
第二章 神经网络理论基础第19-32页
    2.1 神经网络学习类型第19页
    2.2 前馈神经网络第19-23页
        2.2.1 感知器网络第20-21页
        2.2.2 BP神经网络第21-23页
    2.3 卷积神经网络第23-31页
        2.3.1 卷积层第23-24页
        2.3.2 池化层第24-25页
        2.3.3 激活函数第25-28页
        2.3.4 网络架构第28页
        2.3.5 前向计算第28-29页
        2.3.6 参数更新第29-31页
    2.4 本章小结第31-32页
第三章 实验环境与准备工作第32-38页
    3.1 实验环境第32-33页
    3.2 训练参数第33页
    3.3 数据集第33-35页
        3.3.1 UCF101 数据集第33-34页
        3.3.2 HMDB51 数据集第34页
        3.3.3 Kinetics400 数据集第34-35页
    3.4 数据预处理第35-37页
        3.4.1 抽帧第35页
        3.4.2 图片标准化第35-36页
        3.4.3 归一化第36-37页
    3.5 本章小结第37-38页
第四章 基于注意力机制的多路视频分类模型第38-59页
    4.1 基于多路视频分类模型MSNet第38-46页
        4.1.1 3D视频特征提取第38-39页
        4.1.2 RGB图片特征提取第39-40页
        4.1.3 光流特征提取第40-42页
        4.1.4 音频特征提取第42-45页
        4.1.5 基于多路视频分类模型MSNet第45-46页
    4.2 基于注意力机制的多路模型MSANet第46-48页
        4.2.1 注意力机制第46-47页
        4.2.2 MSNet+注意力机制第47-48页
    4.3 模型训练第48-51页
        4.3.1 损失函数第48-49页
        4.3.2 Softmax第49页
        4.3.3 参数初始化第49-50页
        4.3.4 更新参数第50-51页
    4.4 MSNet实验结果分析第51-55页
        4.4.1 单模态结果分析第52-53页
        4.4.2 双模态结果分析第53-54页
        4.4.3 三模态结果分析第54-55页
    4.5 MSANet实验结果分析第55-57页
    4.6 本章小节第57-59页
第五章 基于跨模态的视频检索第59-69页
    5.1 模态特征映射第59-60页
        5.1.1 汉明空间第59-60页
    5.2 评价标准第60-61页
    5.3 网络结构第61-65页
        5.3.1 模态分类器第63-64页
        5.3.2 特征映射器第64-65页
        5.3.3 优化过程第65页
    5.4 跨模态检索网络第61-66页
    5.5 实验结果第66-68页
    5.6 本章总结第68-69页
第六章 总结与展望第69-71页
    6.1 工作总结第69-70页
    6.2 未来研究方向第70-71页
致谢第71-72页
参考文献第72-76页
攻读硕士期间取得的研究成果第76页

本篇论文共76页,点击 这进入下载页面

 
 
Copyright(C) All Rights Reserved
客服QQ:304386486
目录由用户 芹芹** 提供,作者删除入口请点击这里