77范文网 - 专业文章范例文档资料分享平台

分布式文件系统存储介质评测与分析(2)

来源:网络收集 时间:2021-09-24 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

服务.

当前的分布式存储系统一般使用传统机械磁盘作为存储介质来构建分布式文件系统,但随着其它存储技术的进步,这种状况正在发生变化.固态硬盘

(SolidStorage

Device,SSD)和动态随机访问存储

器(DynamicRandomAccessMemory,DRAM)的价格正在快速下降,性能不断提升,基于SSD或DRAM的分布式存储方案已经成为数据存储领域的研究热点.这里,SSD泛指使用NANDFlash组成的通用存储设备,由控制单元和Flash芯片两部分组成.加利福尼亚大学Caulfield等人使用Flash存储器来构建高速、低能耗的集群GordonE23,并针对数据密集型的应用进行了实验分析,结果显示Gordon的性能和能耗分别是基于磁盘的集群的150%和40%左右.卡内基 梅隆大学Andersen等人提出了一种低电压的数据密集型计算架构,并利用低功耗的闪存节点搭建快速、可扩展、节能的Key-Value查询平台[3].斯坦福大学的Outerhout等人提出了一种基于DRAM构建云存储的方案RAMCIoud[4],他们尝试以DRAM作为存储介质来构建超高性能存储系统.

事实上,构建分布式文件系统需要考虑多方面的因素,底层存储介质的性价比和上层分布式文件系统的效率是两个最基本的、最重要的影响因素.一般而言,存储介质的性价比由性能、价格和能耗等因素决定.磁盘作为目前主流的存储介质,虽然价格较低,但它的机械构造特性导致它难以满足高并发随机访问的要求.由于多核处理器技术的迅猛发展,磁盘T/O性能与处理器性能的差距正变得越来越大,已经成为分布式文件系统的性能瓶颈.而SSD访问速率高、能耗低,被认为有可能替代磁盘成为主流存储介质.但是,其价格较高、容量较小和写人次数有限等问题限制了其快速普及.基于DRAM的存储方式能够提供更高的性能,但存在价格昂贵、数据易失、耗电量大等问题.

存储介质的评测和分析对构建分布式文件系统过程中如何选取存储设备具有重要的指导作用,对分布式文件系统的研究也具有参考价值.但是,当前

万方数据

的绝大多数研究仅对单存储器进行评测和分析.本文利用不同的存储介质构建分布式存储系统,充分考虑存储介质价格和能耗等因素,测试了不同存储介质上分布式文件系统的性能,并对磁盘、SSD和DRAM进行了评测分析.

基于对不同存储介质上分布式文件系统的性能表现,本文提出了一种存储介质性价比的评价模型.文章通过收集磁盘、SSD和DRAM的价格和能耗数据,按照最小二乘法原理设计了存储介质价格变化的指数拟合函数,同时测试了HDFS、MooseFS

和CarrierFS3种文件系统在磁盘、SSD和DRAM

介质上的数据吞吐率.基于对价格和能耗的分析数据和分布式文件系统的性能测试分析,我们提出一种存储介质性价比的评测模型.根据评测模型,本文大胆预测了2015年和2020年不同介质的性价比的变化情况,并分析了当前和未来不同存储介质的特

性和适用范围.

本文第2节简要介绍针对SSD和DRAM评测与分析的研究;第3节介绍存储介质的价格变化,并按照最小二乘法原理设计了存储介质的价格拟合函数;第4节测试分布式文件系统部署在不同存储介质上的读写性能;基于价格、能耗和文件读写性能3个因素,我们在第5节中提出一种存储介质性价比的评测模型,并对磁盘、SSD和DRAM进行了性价比分析;第6节总结全文.2

相关工作

本节着重介绍针对SSD和DRAM性能评测和

性价比分析的相关研究.

2.1

SSD评测与分析

Sehmidt[53等人将SSD应用到纯XML数据库管理系统(DBMS)当中,以减少DBMS的总成本.Karsten的研究显示,普通SSD产品在随机写方面的性能方面并不高.该研究改进了数据库的读写机制,增加数据库的写入缓存,以克服SSD随机写入方面的性能缺陷.文章首先分析了DBMS的总成本,认为能耗将是未来DBMS最主要的成本;接着以总成本作为衡量标准,分析SSD和磁盘的性价比,并认为在DBMS应用领域SSD将替代磁盘成为主流的存储介质.在某些对总吞吐率要求较高、不适合用总成本作为衡量标准的领域,SSD仍然不存在优势,混合使用SSD和磁盘将可以发挥各自的性能优势.

许春聪等:分布式文件系统存储介质评测与分析

1875

Pohe[63等人使用IOZone对2008年上市的5款SSD产品和2005年、2006年上市的3款磁盘产品进行了性能测试.结果显示,对于顺序读写,SSD的读写速率分别是磁盘的lo倍和5倍;对于随机读写,SSD的读写速率分别是磁盘的200倍和135倍.结合价格参数,文章进一步分析了磁盘和SSD的性能价格比.结果显示,顺序读写时,SSD与磁盘的性价比相近;随机读写时,SSD的性价比是磁盘的

10倍左右.

Narayanan[73等人针对容量、随机I/0速率、顺序传输速率、容错、单元价格和系统总成本等指标,使用真实工作负载记录测试和分析了基于磁盘和基于SSD构建数据中心的性价比.Narayanan等人的研究目的是寻求满足性能要求的最低成本配置.文章首次将“结合性能模型的最优化求解模型,,I-s-9]应用于SSD的评测,并给出了可以应用于其它存储技术评测的解决方案.根据真实工作负载记录的测试,使用SSD替代磁盘并不是一个好选择,只有SSD的价格下降3"---3000倍时,其性价比才能够和基于磁盘的存储系统相近.使用SSD作为缓存的效果也并不明显,因为仅有10%左右的工作负载能够获得更高的性价比.

2.2

DRAM评测与分析

为了解决基于磁盘的存储系统所面临的性能瓶颈,Ousterhout提出了基于DRAM的云存储——RAMClouds[4].这种方式将数据完全存储于DRAM中,其目标是达到基于磁盘存储100~1000倍的数据吞吐率和100~1000倍的访问延迟.作者认为应该从根本上对现有的数据存储模式进行改进,包括重新设计交换机,重新设计副本策略、数据模型、数据分布策略、系统可扩展性方式、一致性维护方法等.目前,RAMCloud还处在理论研究和设计阶段.

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说公务员考试分布式文件系统存储介质评测与分析(2)在线全文阅读。

分布式文件系统存储介质评测与分析(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/gongwuyuan/1249542.html(转载请注明文章来源)

相关推荐:

Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: