文献知网节
  • 记笔记

Bigtable分布式存储系统的研究

史晓丽

西安电子科技大学

摘要:云存储是云计算的核心内容,其市场潜力巨大。Bigtable分布式数据存储系统是Google为其内部海量的结构化数据开发的云存储技术,是Google的第三项云计算关键技术。Bigtable具有高可靠性、高性能、可伸缩等特性,是所有云时代分布式存储系统的开发蓝本。然而,Bigtable中仍存在许多亟待改进的地方。本文首先对Bigtable的实现细节进行具体的表述,并在深入了解Bigtable架构、逐步剖析Bigtable实现细节的基础上,提出了Bigtable在批量插入、主服务器故障恢复、SSTable压缩机制、子表服务器重启、时间轴访问效率低和读操作延迟方面的问题。并在系统分析各个问题的产生原因之后,给出了这些问题可能的解决方案。对于每种方案,都通过仿真或性能分析,给出了新方案在解决Bigtable原有问题上的优势。本文针对Bigtable常规方法在批量插入时会导致子表频繁分裂的问题,给出了带预估期的批量插入方案。对于Bigtable主服务器重启操作流程复杂、资源和时间消耗多的问题,本文将检查点机制应用到主服务器的恢复中,给出了带检查点的主服务器恢复机制。对于Bigtable原压缩机制对周期的选取要求较高的问题,给出了一种基于数量的压缩方案。对于Bigtable中子表服务器重启不能有效利用其本地磁盘上的SSTable文件,增加不必要的网络通信和数据传输的问题,本文给出了子表服务器初始化的新方案。对于Bigtable在时间轴上访问低效的问题,本文给出了带时间索引的SSTable设计。对于Bigtable中元操作延迟的问题,本文给出了让子表服务器一边从GFS上读取数据,一边与客户端通讯将数据返回给客户端的方案。
  • 专辑:

    信息科技

  • 专题:

    计算机硬件技术

  • 分类号:

    TP333

导师:

樊凯;

下载手机APP用APP扫此码同步阅读该篇文章

下载:456 页数:56 大小:2580K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关基金文献
  • 关联作者
  • 攻读期成果
  • 相关视频