10期许春聪等:分布式文件系统存储介质评测与分析
10个节点作为数据服务器.所有节点的配置相同,具体如表3所示.
表3测试节点配置表
项目
规格
CPU
Xeorl
1.6GH2
内存
4个DDR2—533MHz/1GB
硬盘160GB,8MB缓存。SATA300MBps接口SSD
OCZ30GB,32MB缓存
OS
Ubuntu
8.04
Server
网络千兆以太网
4.2测试结果
读写吞吐率测试所采用的数据集为多组聚合大小为2GB的文件集,构成每组测试数据集的文件大小分别为1GB,512MB,…,32KB.
4.2.1
HDFS读写吞吐率
HDFS部署在磁盘、SSD和DRAM上时,文件写入速率如图6所示.可以看出,基于DRAM的写入速率最大,基于磁盘的写入速率最小.当文件大小大于2MB时,基于DRAM的写入速率优势明显.
∞
&
\至甜古|ll缸寤
籁
文件大小/B
图6HDFS部署在不同存储介质上的写入速率
HDFS部署在磁盘、SSD和DRAM上时,文件读取速率如图7所示,三者性能差别不大.当文件大小小于2MB时,三者的读取速率随文件大小的增大而快速提升.当文件大小大于2MB时,三者的读取速率均大于50Mbps.
∞&羔\
姗
鲁帕
骚籁
图7HDFS部署在磁盘、SSD和DRAM上的读取速率
4.2.2
MooseFS读写吞吐率
MooseFS部署在磁盘、SSD和DRAM上时,文件写入速率和读取速率分别如图8和图9所示.当文件大小小于2MB时,MooseFS在3种存储介质上的读写性能均随文件大小的增大而快速提升.
万方数据
&80\
曼60
嚣。o鉴20
辐0
图8
MooseFS部署在磁盘、SSD和DRAM上的写入速率
&
∞
茎\糌古13缸氅籁
图9
MooseFS部署在磁盘、SSD和DRAM上的读取速率
从图8可以看出,当文件大小大于2MB时,MooseFS基于DRAM的写入速率明显大于基于SSD或磁盘的写入速率.如图9所示,MooseFS基于DRAM和SSD上的读取速率相差不大,二者均为基于磁盘写入速率的1.4倍左右.
4.2.3
CarrierFS读写吞吐率
CarrierFS部署在磁盘、SSD和DRAM上时,文件写入速率和读取速率分别如图10和图11所示.当文件大小小于2MB时,CarrierFS在3种存储介质上的读写性能均随文件大小的增大而快速提升.
&
∞
\
兰糌
吉|雌曙妊
图10CarrierFS部署在磁盘、SSD和DRAM上的写入速率
。60
盆50
墨40
等30舱20
蠢1:
文件大d,/B
CarrierFS部署在磁盘、SSD和DRAM上的读取速率
CarrierFS基于磁盘、SSD和DRAM的读写速文件大小小于2MB时,CarrierFS的写入速率明显大于HDFS的写人性能.这说明在进行小文件数据
图11
率差别不大.通过图6和图10的对比可以看出,当
计算机学报
访问时。CarrierFS具有较高的数据写入性能.为T^k√。。×t。×3600.
存储介质平均每天总花费等于存储介质每天的折旧费与电费之和.用C。表示所需存储介质m的大小,P。表示存储介质m的单价,Y。表示存储介质的使用年数。那么存储介质每天的折旧费可以表示为
5性价比理论模型与分析
5.1理论模型的建立
存储介质的性价比主要与存储设备的性能、价格和能耗等因素相关.我们用c户^¨。。表示文件大小为file—size时,存储介质类型为优时的性价比,它等于系统平均每天数据访问总量与存储介质平均每天总花费的比值.
用T触一妇表示文件大小为file—size时文件系统的数据吞吐率,t。表示存储设备平均每天运行的小时数,那么系统平均每天的数据访问总量可表示
』镰.用,z“m。表示所需存储介质m的数量,
)“sc/\0uu
pw。.。表示存储介质优在工作时的功耗,pw…。表示存储介质m在空闲时的功耗,P,表示每千瓦时电量的价格,那么存储介质每天消耗的电费可以表示为
(num。×pw。.。×£。+咒UTl2。×pw。。。。×(24一£。))×以.
以上推导可得,性价比f户触一。…的评价公式
如下:
讯…户吾甄磊瓦iTfile_isiz,×t=wv×36瓦00
5.2
j磊‘
参数计算
根据5.1节的性价比理论模型,我们需要计算
SSD的擦除次数约为10000次.正常工作境况下,当前主流SSD的寿命在100000~180000h之间,远大于5年.另外,按照写入放大因子为3[11|,系统每天工作24h,吞吐率为第4节的测试值计算,可得SSD的寿命大于5年.因此,本文以设备更新周期作为磁盘、SSD和DRAM的寿命,即Y。。=5.
(4)存储介质的价格
存储介质的价格P。如表2,单位为美元/GB.本文旨在对比3种存储介质的性价比,因此我们不考虑多种存储介质混合使用的情况,采用磁盘、SSD和DRAM构成多级存储的架构不属于本文的分析范围.
(5)能耗
表4平均吞吐率
以下参数:
(1)数据吞吐率T^¨;。
由第4节的测试结果可知,文件大小是影响系统吞吐率的重要因素.根据测试结果,我们分别分析了大文件和小文件两种文件类型的存储介质的性价比,对应的文件大小分别为大于32MB和小于
1MB.
我们假设读取和写入的时间比例相同,所以将第4节中3种文件系统指定文件大小的读取和写入速率的平均值作为了■。泌的值.计算可得了■。协的值如表4.
存储介质的能耗分为工作状态能耗和空闲状态能耗两种,如表5所示[1
2|.
表5存储介质能耗
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说公务员考试分布式文件系统存储介质评测与分析(4)在线全文阅读。
相关推荐: