“大数据”作为时下最火热的IT行业的词汇,随之数据仓库、数据安全、数据分析、数据挖掘等等围绕大数量的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。笔者愚钝,大数据有多大,一直没有清晰的概念,故此简单的科普研究,分享至此: 

最小的基本单位是Byte应该没多少人不知道吧,下面先按顺序给出所有单位:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB

我只知道前五个,估计大多数人都知道吧,按照进率1024(2的十次方)计算:

1Byte = 8 Bit

1 KB = 1,024 Bytes 

1 MB = 1,024 KB = 1,048,576 Bytes 

1 GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes

1 TB = 1,024 GB = 1,048,576 MB = 1,073,741,824 KB = 1,099,511,627,776 Bytes

1 PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes

1 EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes

1 ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes

1 YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes

在计算的时候,发现XP自带的计算器根本没办法算了,不得又重下了个能算的计算器。

光看这些数字估计你没什么感觉,那现在就算点好想象的吧,下面拿NB为例

在现阶段的TB时代,1TB的硬盘的标准重量是670g

1NB=2的60次方TB=1152921504606846976TB=1152921504606846976个1TB硬盘

总重量约为77245740809万吨 目前运载量为56万吨的 诺克耐维斯号 巨型海轮

也就是说 储存1NB的数据的硬盘要 诺克耐维斯号 最少来回拉 1 379 388 229 次 约14亿次才能将这些数据运到地点,估计1000个诺克耐维斯号都要报销。

如果以上地数据过于庞大,还是找不到感觉,那么给个实际的数据:计算机报上看到荷兰银行的20个数据中心有大约7PB磁盘和超过20PB的磁带存储,而且每年50%~70%存储量的增长,计算一下27PB大约为 40万个80G的硬盘大小。

半导体行业的摩尔定律似乎还不足以形容数据增长的快速性,大数据量的环境下促生技术的变革和进步,Hadoop技术、敏捷商业智能等等随之出现的解决方案似乎有望为大数据问题带来些许曙光。