卫生研究

医学教育与医学边缘学科论文_全球卫生领域研究

 
文章目录

摘要

ABSTRACT

1 引言

1.1 研究背景

1.2 研究目的及意义

1.3 研究现状

    1.3.1 全球卫生研究

    1.3.2 知识图谱研究

    1.3.3 主题模型研究

1.4 研究内容与文章结构

1.5 技术路线图

1.6 研究创新点

2 相关概念与方法

2.1 全球卫生概述

2.2 知识图谱概述

2.3 LDA模型概述

2.4 本章小结

3 全球卫生主题研究流程

3.1 基于LDA模型全球卫生主题分析

    3.1.1 基于LDA模型全球卫生主题分析流程

    3.1.2 LDA主题分析理论

3.2 基于科学计量的知识图谱研究

    3.2.1 知识图谱绘制流程

    3.2.2 知识图谱绘制与解读

3.3 本章小结

4 全球卫生研究主题发现与演化分析案例

4.1 使用LDA模型进行全球卫生研究主题发现与演化分析

    4.1.1 数据来源与预处理表示

    4.1.2 全球卫生研究主题分析

4.2 基于知识图谱的全球卫生研究主题发现与演化分析

    4.2.1 数据来源与预处理表示

    4.2.2 全球卫生研究知识图谱分析

    4.2.3 全球卫生研究主题演化

4.3 LDA模型与知识图谱主题探测比较

    4.3.1 文本处理能力

    4.3.2 主题数量比较

    4.3.3 主题探测效果检验

5 结论与展望

5.1 研究结论

5.2 未来展望

致谢

参考文献

全球卫生领域研究热点与主题分析:基于知识图谱和 LDA 模型

参考文献

附件1 攻读学位期间发表论文目录

文章摘要:[目的]梳理全球卫生研究发展历史,主题构成,不同时间段热点主题与主题演化过程。比较科学知识图谱理论与LDA模型在科学文献主题探测与主题演化研究中的效果。[方法]研究分别使用知识图谱绘制软件CitesapceⅡ和LDA文本挖掘挖掘工具,基于Python语言的gensim扩展包,对Web of Science数据库下载的题录信息进行分析与图谱绘制,具体方法有:1)利用词频分析法统计1997-2018期间全球卫生的发文量变化,国家发文量,期刊载文量分布;2)运用计量分析及知识图谱软件,对期刊和关键词进行共被引分析,探测全球全球卫生的主题分布和核心期刊分布,对作者进行共现分析,绘制作者网络合作图,发现核心作者群;3)利用LDA主题模型对全球卫生研究进行主题集合构建和主题演化分析。[结果]1)发文量:1997-2018发文量变化呈现典型的幂函数特征,1997-2006为萌芽期,2007-2015为快速增长期,2016-2018发文量进入平稳期甚至略有减少。2)期刊分布:《Lancet》期刊发文量与被引量远高于其他期刊,是全球卫生最权威期刊。除此之外,用期刊发文-被引P-P图将期刊分类为四个区域:核心区,弱势区,潜在热点区,权威区。3)主题分布:LDA主题模型将全球卫生主题分为:传染病防治,精神健康,全球卫生体系能力加强,妇幼保健,烟草与口腔健康,环境健康,健康评估,低收入国家疾病问题,健康公平性。知识图谱构建的主题分布有:动物源性疾病,妇幼健康,全球卫生体系加强,发展中国家卫生问题,非传染疾病与经济问题,疾病风险与健康评估,全球卫生政策与传染病预防,国际卫生合作,全球卫生内涵。4)潜在热点主题:利用LDA主题模型演化和知识图谱关键词突现探测发现的潜在热点主题有:全球健康教育,全球卫生能力加强,国际卫生治理政策与框架,精神健康。5)LDA主题模型构建可以自订聚类主题数目,了解主题内部词项构成,相较于知识图谱研究方法在自由度和评价科学性上具有一定优势。[结论]通过对全球卫生研究的科研文献的知识图谱绘制解读和LDA模型主题分析,获得了全球卫生研究领域的学科演进历史,热点主题分布,作者合作与期刊分布情况,能够为科研研究者研究该领域提供知识基础。通过对比使用LDA主题模型与知识图谱方法,比较了两者的文本处理能力,主题探测效果和主题获取能力,发现了LDA文本挖掘作为知识图谱的补充方法在科研文献计量领域的巨大潜力,验证了LDA模型进行主题挖掘的有效性与科学性,并且结合LDA模型可以有效提高科研文献计量的精度。

文章关键词:

论文分类号:G353.1;R-05