基于文本内容的不良短信息识别挖掘方法 | |
论文目录 | |
摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
第一章 绪论 | 第11-17页 |
1.1 研究意义与背景 | 第11-12页 |
1.2 国内外研究现状 | 第12-14页 |
1.3 研究目标及主要工作 | 第14-15页 |
1.4 论文组织结构 | 第15-17页 |
第二章 相关技术研究 | 第17-29页 |
2.1 文本数据预处理 | 第17-18页 |
2.2 词嵌入模型 | 第18-22页 |
2.2.1 Word2Vec模型 | 第18-21页 |
2.2.2 FastText模型 | 第21-22页 |
2.3 深度学习 | 第22-25页 |
2.3.1 循环神经网络 | 第22-24页 |
2.3.2 注意力机制 | 第24-25页 |
2.4 半监督学习算法 | 第25-27页 |
2.4.1 生成式半监督学习方法 | 第26页 |
2.4.2 半监督SVM | 第26-27页 |
2.4.3 基于图的半监督学习方法 | 第27页 |
2.5 文本表示模型 | 第27-28页 |
2.5.1 向量空间模型 | 第27页 |
2.5.2 主题模型 | 第27-28页 |
2.5.3 Doc2Vec模型 | 第28页 |
2.6 本章小结 | 第28-29页 |
第三章 基于深度学习的不良短信识别模型 | 第29-41页 |
3.1 引言 | 第29页 |
3.2 DBiGRU-Atten模型 | 第29-32页 |
3.2.1 不良短信识别模型 | 第29-31页 |
3.2.2 注意力机制 | 第31-32页 |
3.3 基于N-Gram特征的词嵌入模型 | 第32-34页 |
3.3.1 FastText文本分类模型 | 第32-33页 |
3.3.2 FastText词嵌入模型 | 第33-34页 |
3.4 实验过程及结果分析 | 第34-39页 |
3.4.1 数据预处理 | 第35-36页 |
3.4.2 模型评价指标 | 第36页 |
3.4.3 DBiGRU-Atten模型评估 | 第36-38页 |
3.4.4 FastText词嵌入模型评估 | 第38-39页 |
3.5 本章小结 | 第39-41页 |
第四章 基于半监督学习的不良短信内容挖掘模型 | 第41-53页 |
4.1 引言 | 第41页 |
4.2 不良短信内容分类模型 | 第41-44页 |
4.2.1 标签传播算法 | 第41-42页 |
4.2.2 数据采样方案 | 第42-44页 |
4.3 Doc2Vec文本表示模型 | 第44-45页 |
4.3.1 PV-DM结构模型 | 第44-45页 |
4.3.2 PV-DBOW结构模型 | 第45页 |
4.4 实验过程及结果分析 | 第45-51页 |
4.4.1 测试数据准备 | 第46页 |
4.4.2 文本多分类评价指标 | 第46-47页 |
4.4.3 不良短信数据采样方案评估 | 第47-48页 |
4.4.4 文本表示模型评估 | 第48-51页 |
4.5 本章小结 | 第51-53页 |
第五章 不良短信内容分析系统实现 | 第53-61页 |
5.1 引言 | 第53页 |
5.2 系统开发环境及框架简介 | 第53-54页 |
5.3 系统描述与整体设计 | 第54页 |
5.4 系统子模块功能实现 | 第54-57页 |
5.4.1 不良短信识别模块 | 第55-56页 |
5.4.2 不良短信内容分类模块 | 第56-57页 |
5.4.3 数据可视化模块 | 第57页 |
5.5 系统功能测试 | 第57-58页 |
5.6 本章小结 | 第58-61页 |
第六章 总结与展望 | 第61-63页 |
6.1 工作总结 | 第61-62页 |
6.2 未来展望 | 第62-63页 |
参考文献 | 第63-67页 |
致谢 | 第67-69页 |
攻读学位期间取得的研究成果 | 第69页 |
本篇论文共69页,点击
这进入下载页面 |
|
Copyright(C) All Rights Reserved |
客服QQ:304386486 |
目录由用户 lixuhei** 提供,作者删除入口请点击这里 |