本书主要介绍软件知识图谱构建及应用研究领域中的关键技术和研究成果。针对软件知识实体抽取任务存在的实体歧义、实体变体、无法识别未登录词等问题,提出一种基于多特征融合和语义增强的软件知识实体抽取方法。针对软件知识实体语义特征弱、实体语义关系模糊和句法依存关系特征建模存在的欠剪枝或过剪枝问题,提出一种基于句法依赖度和实体感知的软件知识实体关系抽取方法。针对传统流水线方法存在的任务依赖问题和软件知识社区文本存在的实体重叠问题,提出一种基于span级对比表示学习的软件知识实体和关系联合抽取方法。针对基于社区的软件专家推荐存在的标签依赖、交互数据稀疏和隐含知识关联信息 缺失等问题,提出一种基于知识图谱和领域知识偏好感知的软件专家推荐方法。 本书可为读者进行系统学习和深入研究提供参考,可作为高等院校计算机、人工智能等专业本科生和研究生的选修教材或参考书。互联网技术研究与开发人员也可通过本书进一步了解知识图谱技术。
随着社会需求的变化,越来越多的人工智能应用涉及多标签学习问题,如文本分类、语义标注、社交网络、基因预测和疾病诊疗等,多标签学习已成为当前人工智能领域的研究热点之一。本书基于集成学习相关理论,围绕多标签局部依赖、多标签缺失补全、极端量级多标签学习、长尾多标签学习和开放词多标签学习等一系列问题进行展开,提出了一系列高效的集成多标签学习方法。我们提出了一种集成多标签学习方法,该方法巧妙融合了多标签学习与集成学习的优势,旨在克服传统多标签学习在多样化应用场景中面临的挑战。本书将详细阐述方法在不同实际场景下的具体解决方案及其背后的技术支撑,同时,通过展示一些典型的实际应用问题解决案例,来验证提出方法在处理复杂、多维度标签任务上的优越性,为相关领域的研究与应用提供了宝贵的参考和启示。 本书可作为高等院校计算机科学、人工智能及机器学习专业师生的教学参考书,也可为大数据处理、人工智能应用开发领域的专业人员、科技工作者及研究人员提供宝贵的实践指南与理论参考。