77范文网 - 专业文章范例文档资料分享平台

分布式文件系统存储介质评测与分析(4)

来源:网络收集 时间:2021-09-24 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

10期许春聪等:分布式文件系统存储介质评测与分析

10个节点作为数据服务器.所有节点的配置相同,具体如表3所示.

表3测试节点配置表

项目

规格

CPU

Xeorl

1.6GH2

内存

4个DDR2—533MHz/1GB

硬盘160GB,8MB缓存。SATA300MBps接口SSD

OCZ30GB,32MB缓存

OS

Ubuntu

8.04

Server

网络千兆以太网

4.2测试结果

读写吞吐率测试所采用的数据集为多组聚合大小为2GB的文件集,构成每组测试数据集的文件大小分别为1GB,512MB,…,32KB.

4.2.1

HDFS读写吞吐率

HDFS部署在磁盘、SSD和DRAM上时,文件写入速率如图6所示.可以看出,基于DRAM的写入速率最大,基于磁盘的写入速率最小.当文件大小大于2MB时,基于DRAM的写入速率优势明显.

\至甜古|ll缸寤

文件大小/B

图6HDFS部署在不同存储介质上的写入速率

HDFS部署在磁盘、SSD和DRAM上时,文件读取速率如图7所示,三者性能差别不大.当文件大小小于2MB时,三者的读取速率随文件大小的增大而快速提升.当文件大小大于2MB时,三者的读取速率均大于50Mbps.

∞&羔\

鲁帕

骚籁

图7HDFS部署在磁盘、SSD和DRAM上的读取速率

4.2.2

MooseFS读写吞吐率

MooseFS部署在磁盘、SSD和DRAM上时,文件写入速率和读取速率分别如图8和图9所示.当文件大小小于2MB时,MooseFS在3种存储介质上的读写性能均随文件大小的增大而快速提升.

万方数据

&80\

曼60

嚣。o鉴20

辐0

图8

MooseFS部署在磁盘、SSD和DRAM上的写入速率

茎\糌古13缸氅籁

图9

MooseFS部署在磁盘、SSD和DRAM上的读取速率

从图8可以看出,当文件大小大于2MB时,MooseFS基于DRAM的写入速率明显大于基于SSD或磁盘的写入速率.如图9所示,MooseFS基于DRAM和SSD上的读取速率相差不大,二者均为基于磁盘写入速率的1.4倍左右.

4.2.3

CarrierFS读写吞吐率

CarrierFS部署在磁盘、SSD和DRAM上时,文件写入速率和读取速率分别如图10和图11所示.当文件大小小于2MB时,CarrierFS在3种存储介质上的读写性能均随文件大小的增大而快速提升.

兰糌

吉|雌曙妊

图10CarrierFS部署在磁盘、SSD和DRAM上的写入速率

。60

盆50

墨40

等30舱20

蠢1:

文件大d,/B

CarrierFS部署在磁盘、SSD和DRAM上的读取速率

CarrierFS基于磁盘、SSD和DRAM的读写速文件大小小于2MB时,CarrierFS的写入速率明显大于HDFS的写人性能.这说明在进行小文件数据

图11

率差别不大.通过图6和图10的对比可以看出,当

计算机学报

访问时。CarrierFS具有较高的数据写入性能.为T^k√。。×t。×3600.

存储介质平均每天总花费等于存储介质每天的折旧费与电费之和.用C。表示所需存储介质m的大小,P。表示存储介质m的单价,Y。表示存储介质的使用年数。那么存储介质每天的折旧费可以表示为

5性价比理论模型与分析

5.1理论模型的建立

存储介质的性价比主要与存储设备的性能、价格和能耗等因素相关.我们用c户^¨。。表示文件大小为file—size时,存储介质类型为优时的性价比,它等于系统平均每天数据访问总量与存储介质平均每天总花费的比值.

用T触一妇表示文件大小为file—size时文件系统的数据吞吐率,t。表示存储设备平均每天运行的小时数,那么系统平均每天的数据访问总量可表示

』镰.用,z“m。表示所需存储介质m的数量,

)“sc/\0uu

pw。.。表示存储介质优在工作时的功耗,pw…。表示存储介质m在空闲时的功耗,P,表示每千瓦时电量的价格,那么存储介质每天消耗的电费可以表示为

(num。×pw。.。×£。+咒UTl2。×pw。。。。×(24一£。))×以.

以上推导可得,性价比f户触一。…的评价公式

如下:

讯…户吾甄磊瓦iTfile_isiz,×t=wv×36瓦00

5.2

j磊‘

参数计算

根据5.1节的性价比理论模型,我们需要计算

SSD的擦除次数约为10000次.正常工作境况下,当前主流SSD的寿命在100000~180000h之间,远大于5年.另外,按照写入放大因子为3[11|,系统每天工作24h,吞吐率为第4节的测试值计算,可得SSD的寿命大于5年.因此,本文以设备更新周期作为磁盘、SSD和DRAM的寿命,即Y。。=5.

(4)存储介质的价格

存储介质的价格P。如表2,单位为美元/GB.本文旨在对比3种存储介质的性价比,因此我们不考虑多种存储介质混合使用的情况,采用磁盘、SSD和DRAM构成多级存储的架构不属于本文的分析范围.

(5)能耗

表4平均吞吐率

以下参数:

(1)数据吞吐率T^¨;。

由第4节的测试结果可知,文件大小是影响系统吞吐率的重要因素.根据测试结果,我们分别分析了大文件和小文件两种文件类型的存储介质的性价比,对应的文件大小分别为大于32MB和小于

1MB.

我们假设读取和写入的时间比例相同,所以将第4节中3种文件系统指定文件大小的读取和写入速率的平均值作为了■。泌的值.计算可得了■。协的值如表4.

存储介质的能耗分为工作状态能耗和空闲状态能耗两种,如表5所示[1

2|.

表5存储介质能耗

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说公务员考试分布式文件系统存储介质评测与分析(4)在线全文阅读。

分布式文件系统存储介质评测与分析(4).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/gongwuyuan/1249542.html(转载请注明文章来源)

相关推荐:

Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: