Facebook:大数据创业的三大机遇

mf_facebookb_f

对于在大数据的海洋寻找机遇的创业公司来说,Facebook的建议非常具有参考价值。Facebook是世界上拥有数据最多的公司之一,也是开发大数据工具最多的公司之一,例如Cassandra NoSQL 数据库和面向Hadoop的的Hive查询语言。Facebook的Hadoop集群目前存储了超过100PB的用户数据。

最近,Facebook工程副总裁Jay parikh和Accel partner的PingLi在接受媒体采访的时候为大数据创业公司指出三大机遇:

机遇一:Hadoop的普及化

大数据最重大的机遇莫过于将想法变成企业能够接受和使用的产品。Hadoop和NoSQL为代表的大数据基础设施技术领域的创新非常活跃。在Facebook,几乎每位员工都需要用到大数据系统来进行用户分析或生成报告,从朋友推荐到定向广告都是如此。这意味着Facebook的大数据系统必须能够与各业务部门的不懂技术的员工也能很好互动。

Facebook的基础设施工程副总裁Jay Parikh认为:目前大数据的普及化方面蕴含着大量创业机会,通过大量的定制化开发工具和可视化用户界面,Facebook的普通员工也能使用复杂的大数据系统,Hive就是在这个过程中诞生的。“大数据往往就是高效率的代名词。因此,”Parikh说道:“Facebook在开发新的大数据工具方面投入非常大,新的工具可以取代过去多个工具才能完成的任务,这让大数据变得更有效率。”

机遇二:大数据不仅仅是Hadoop

如果你跳出Hadoop和NoSQL数据库等现成的基础设施工具圈子,你的眼前就会豁然开朗。Parikh提到Facebook正在开发的诸多大数据相关项目之一——一种基于MySQL的图片数据库,以及为Timeline和Newsfeed开发的新后台。很多初创公司使用Hadoop是因为免费和开源,但为了实现Hadoop方案的功能,他们往往不得不进行大量的开发工作。有些创业公司,例如Precog,干脆抛开Hadoop,从头开发大数据工具。

Ping Li认为:其实有大量的大数据问题与Hadoop毫无关系。

机遇三:数据中心里的大机遇。

大数据潮流意味着今天的数据中心面临变革。为了让数据中心能够更有效率地处理和存储海量历史数据,Facebook的做法是重新设计数据中心,甚至重新设计服务器和机架。Parikh认为,数据中心正在经历一场变革,从过去的电力怪兽向绿色节能型数据中心转变(参考:互联网数据中心浪费惊人、九成电力浪费),同时又不影响用户的数据访问和应用性能。Parikh认为今天大多数企业都面临类似的问题,对于创业公司来说,建设新型数据中心所需要的解决方案和产品是一个热门领域。值得称道的是,Facebook在其开放计算计划中开源了很多数据中心设计方案。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

主要关注社会化商务时代的客户关系管理、业务流程管理、数据挖掘、商业智能和企业协作等领域的新技术、新应用和新趋势。曾长期从事信息化咨询服务和软件开发工作,服务过首都机场、国家电网公司、中国蓝星等企业。邮箱:guanzhigang@ctocio.com

X