(单篇优先)网络出版时间:2018-07-19 11:06:15

基于多重关系主题模型的Web服务聚类方法

石敏刘建勋周栋曹步清文一凭

如何有效的发现合适的Web服务是面向服务计算领域需要解决的核心问题之一。随着Internet上Web服务数量的不断增加,服务的自动发现面临着极大的挑战。将功能相似的Web服务进行聚类是一种有效的服务发现与服务管理方法。目前国内外主流的方法为挖掘Web服务的隐含功能语义信息,如使用LDA主题模型训练提取Web服务功能描述文档的主题信息,然后基于某种聚类算法如K-means将隐含主题分布相似的Web服务聚为一类。然而,Web服务的功能描述文档通常短小,目前大部分主题模型无法对短文本进行良好地建模,从而影响了Web服务聚类的效果。针对该问题,文中提出了一种考虑多重Web服务关系的概率主题模型MR-LDA,其可对Web服务之间相互组合的关系以及Web服务之间共享标签的关系进行建模,能有效提高Web服务聚类的精度。同时,基于该MR-LDA主题模型进一步提出了一种有效的Web服务聚类算法MR-LDA+,该算法首先利用上述多重Web服务关系信息对Web服务隐含主题分布概率矩阵进行修正,然后根据这些隐含主题对Web服务进行聚类。基于Programmable Web收集的真实数据实验表明,文中所提出的方法明显优于其它Web服务聚类算法。

国家自然科学基金(No.61572187,61300129)、湖南省自然科学基金(No.2018JJ2139)、湖南省教育厅创新平台开放基金项目(No.17K033);

Web服务; 聚类; 多重关系网络; 先验知识; 主题模型;

TP301

计算机学报

Chinese Journal of Computers

ISSN:0254-4164

中文核心期刊

18917878K
在线咨询 用户反馈