摘要:随着生物信息学、信息检索等领域的发展,带有通配符和长度约束的模式匹配问题引起了广泛关注。该问题扩展了精确模式匹配问题,使匹配更加灵活,同时也增加了匹配的复杂性,极大地提高了非线性匹配算法的复杂度。求解该问题的匹配算法的效率与问题的解空间密切相关,而目前针对该问题的解空间及其特征尚缺乏系统的研究。鉴于此,描述了该问题的解空间,并分析了解空间的可分性。之后,提出解空间划分算法SPLIT,并分析了SPLIT的时间复杂性。实验部分以3个匹配算法为对照,在真实DNA数据集下,使用了5109组模式。实验结果表明,SPLIT不影响匹配解的结构,且可以有效降低非线性匹配算法的时间消耗。
基金资助:
国家自然科学基金:港澳学者合作研究基金项目(61229301),国家自然科学基金(61305062); 博士后面上基金项目(2012M511403); 安徽省自然科学基金(1308085QF102)资助;
- 专辑:
信息科技
- 专题:
计算机软件及计算机应用
- 分类号:
TP301.6;TP391.1
引文网络
相关推荐
- 相似文献
- 读者推荐
- 相关基金文献
- 关联作者
- 相关视频