第33卷第10期
2010年10月
——一r—_————-—一—;=;=======:===;====
计
算
机
学
报
v01.33
No.10
CHlNESEJOURNAL0FCOMPUTERS
Oct.2010
分布式文件系统存储介质评测与分析
许春聪
黄小猛吴诺孙宁伟杨产文
100084)
(清华大学计算机科学与技术系信息科学与技术国家实验室北京
摘要文中分析了磁盘、SSD和DRAM的价格和能耗,测试了分布式文件系统HDFS、MooseFS和CarrierFS部
署在不同存储介质上的数据吞吐率,接着提出了一种存储介质的性价比理论模型,并分析了当前、2015年和2020年不同存储介质的性价比和变化趋势.通过性价比分析可得,DRAM具有较大的性价比优势。适合于高并发随机访问应用.随着DRAM容量的快速提升,未来DRAM有可能成为可选的数据存储介质.当前,SSD虽然具有较好的访问性能,但其价格高、容量小、性价比低于磁盘.2015年SSD的性价比将超过磁盘,有可能替代磁盘成为大规模存储系统的基本存储设备.
关键词分布式文件系统;吞吐率;存储介质
中图法分类号TP301
OOI号:10.3724/SP.J.1016.2010.01873
Performance
TestingandAnalysistoStorage
Medium
SUN
ofDistributedFileSystem
YANGGuang—Wen
ScienceandTechnology。
XUChun—Cong
(TsinghuaNational
HUANGXiao—Meng
forhyormationScience
WUNuo
and
Ning—Wei
LaboratoryTechnology.DepartmentofComputer
100084)
TsinghuaUniversity,Beijing
Abstract
Thispaperinvestigatesthe
priceand
powerconsumption
ofthe
disks,SSD,and
DRAM,andalsotestedthereadandwritethroughputsofHDFS,MooseFS,andCarrierFSbased
on
thesestoragemediums.Then,itproposes
an
estimationmodelofperformance—priceratiofor
thesestoragemediumsandalsopredictedandthechangetrendsoftheirperformance—priceratioin2015and2020.Fromtheanalysisresults,weperformance—priceratioandpacitygrows,itwillbecomeSSDdue
cail
are
cansee
thatDRAMhastheadvantageofhigh
access
suitableforhighlyparallelrandom
applications.Asits
near
ca—
an
optionaldeviceforstoragesystemsinthe
future.Although
providebetter
access
performancethanharddisks,ithaslowerperformance—priceratio
to
itshigherpriceandsmallercapacity.However,theauthorspredictthatin2015,itsper-
to
formance—priceratiowillbecomehigherthanharddisksandthusmaysubstituteforharddisksbecomethemajordeviceforlarge—scalestoragesystems.
Keywords
distributedfilesystem;throughput;storagemedium
的核心基础平台,分布式文件系统的重要性日益凸
引
吉嗣
显.目前,具有代表性的分布式文件系统有Google
的GFS(GoogleFileSystem)E13以及开源的Lustre、
随着云存储应用范围的不断扩展,作为云存储HDFS、MooseFS和清华大学研发的CarrierFS等.
收稿日期:2010—08—22.本课题得到国家自然科学基金(60803121,60773145,90812001,60963005)、国家“八六三”高技术研究发展计划项目基金(2010AA012401)资助.许春聪,男,1980年生,博士研究生,事要研究方向为云计算、分布式文件系统.E-mail:xcc07@mails.tsin—ghua.edu.c11.黄小猛。男。1980年生.博士。助理研究员.研究方向为数据网格、云计算和分布式文件系统.昊谱,男.1983年生,博士研究生,研究方向为分布式数据存储系统.孙宁伟,男,1987年生,本科,研究方向为分布式文件系统.杨广文,男,1963年生。博士,教授,博士生导师,研究领域为数据网格、云计算和分布式存储系统.
万方数据
计算机学报
这些分布式文件系统均面向大规模云存储应用.GFS已在Google内部得到了广泛应用,Hadoop是应用MapReduce的分布式计算模型实现的分布式文件系统,目前应用非常广泛.清华大学计算机系设计的分布式文件系统CarrierFS在清华大学校内存储了70TB的文件数据,为校内文件资源共享提供
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说公务员考试分布式文件系统存储介质评测与分析在线全文阅读。
相关推荐: