05 统计学家的大数据“狂想曲”(1)

正如前一章所说的那样,“大数据”这个词从诞生到流行经历了很长一段时间。

而现在的企业几乎每周都会发布关于“大数据”的报告,杂志和网络媒体上也时常出现“大数据今后的发展”或者“如何在大数据时代生存”等相关文章。如今,只要是稍微关心计算机信息的人,对于“大数据”这个词一定不会感到陌生。

在硬件供应商、系统集成商、独立咨询公司等,有很多期待“大数据”概念可以带来商业机会的人。顺便说一下,那些对计算机和统计学都不太了解的商业评论家们,也纷纷断言“今后是大数据的时代”。

就连那些一提起与阻止列表和收支记录等工作相关的数据记录就只能想到Excel表格的人,也对新数据库的技术很感兴趣,对100多年以前发明的统计方法一窍不通的人也对“数据挖掘”充满期待。由此可见,现在对统计学家来说是最适合大展拳脚的时代。

演奏大数据“狂想曲”的专业术语

但是,对于“大数据”,或者说对于“大数据”的分析会产生什么样的价值,会给投资成本的核算带来多少好处,这些内容究竟又有多少人能够理解呢?

是没有人能够理解,还是理解的人因为与自己的商业利益没有太大的关联,所以没有进一步的宣扬和提倡?不管怎样,对于这方面的问题我们很少会见到与之有关的回答。

取而代之的是,我们经常会听到为了更有效率地处理大规模的数据,推出新产品、新规格、新功能等。

比如在硬件方面,甲骨文公司引以为傲的Exadata系统的性能比以前的数据库系统强大10倍以上,而被称为Hadoop的工作模式,则可以允许在复数硬件上同时对大规模数据进行高速处理。相信很多人都听说过这些信息吧。

读书导航