Etsy公布其数据中心硬件架构设计

racks

当众多互联网公司在DIY数据中心和服务器的过程中互相分享经验和性能参数时,这些面向大规模互联网应用的低成本大规模硬件架构的设计和性能就会不断得到完善和优化,而无需等待服务器厂商的产品/方案上市周期。

电子商务网站Etsy近期经历了几次网站宕机,在做出详细解释后,Etsy本周五决定与外界分享其硬件技术架构的细节。虽然Etsy的规模远不及Facebook,但是作为一个成长性互联网公司Etsy的的硬件架构还是很有参考价值的(Etsy七月份的在线销售额将近7000万美金)。如今软件才是大型网站的核心,所以包括Facebook和Twitter等互联网公司也都曾非常慷慨地公开数据中心硬件架构和技术

超微架构

Etsy所采用的硬件基础设施的技术架构,其最大的特点是大量采用“超微”(Supermicro)服务器,从web服务器到Hadoop大数据集群都有使用。据Etsy员工Laurie Denness的博客透露,Etsy的机房主要采用“超微”(Supermicro)服务器架构——统一采用2U四路服务器,运行从内存缓存到web服务在内的大量工作负载,与eBay等大型互联网公司类似,Etsy也喜欢采用尽可能少的多功能机架来处理多重工作负载。

supermicro chassis with 4 easily serviceable nodes

超微(Supermicro)机箱有四个可用节点

在这个原则之下,Etsy服务器的常见配置是2路8核英特尔E5620 CPU(2.4Ghz),12-96G内存,硬盘采用600G 7200转机械硬盘或者英特尔160 SSD固态硬盘。

值得注意的是,Etsy的系统中没有采用RAID,这对数据冗余可能有些影响。不过Etsy采用了Chef和Cobbler两个工具快速重建失败节点,而且Etsy认为在RAID上浪费电力并不值得:“如果我们的数据中心员工能更换硬盘并在20分钟内恢复服务器,那还有什么必要用两块硬盘做RAID?”

搜索/Solr

Etsy还把通用服务器架构进行升级来满足站内搜索的需要——用16核 Sandy Bridge处理器替换8核英特尔服务器,并增添了大量的固态硬盘。升级后的节点的工作负载提高了四倍,每个节点有96GB内存和一个800GB的SSD固态硬盘存储索引。SSD固态硬盘本身已经足够快,Etsy采用的BitTorrent index distribution,在服务器上建立索引的速度非常快。

更少的服务器=更少的管理维护、更少的耗电量和更少的空间

Hadoop集群

shutterstock_108064520

Etsy的Hadoop节点

此外,Etsy的Hadoop系统和备份也采用“超微”架构,但机箱前部采用了24×2.5硬盘插槽,而不是上述的12×3.5硬盘插槽。虽然Laurie并未透露Etsy的Hadoop集群的规模,但给出了一些节点配置信息:每个2U机架中共有四个节点,每个节点有2×12个英特尔E5646处理器(2.4GHz)、96GB内存和6T2.5寸硬盘(固态硬盘)。每个节点还配备了两个千兆以太网接口,但通常只启用一个。

下面的图表显示了其中一组机器在运行Hadoop任务前后的耗电差异。

备份

作为备份的4U的“超微”机架则安装了362TB硬盘,传输速度高达1.2GB/秒(顺序读写),两个RAID6卷共有60TB的可用空间。

特殊任务

Etsy还采用惠普的1U服务器(HP DL360)运行MySQL数据库和一些对计算性能要求不高的特殊任务,例如Hadoop的名称节点,这些服务器采用了RAID存储架构,确保数据的安全性。

总之,虽然Etsy的硬件技术并无太多惊人之处,但是公开硬件架构本身对于其他互联网公司甚至传统企业来说都是非常有意义的一件事情,况且硬件并不构成互联网公司的核心技术竞争力(软件才是)。当众多互联网公司在DIY数据中心和服务器的过程中互相分享经验和性能参数时,这些面向大规模互联网应用的低成本大规模硬件架构的设计和性能就会不断得到完善和优化,而无需等待服务器厂商的产品/方案上市周期。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

IT到底是重要呢还是重要呢还是重要呢

X