无庸置疑,Google公司是当今世界信息产业的翘楚,同时,我们更应该看到,它和微软等一大批知名公司一样,也是信息技术的研究者和开拓者。且不说Google创立之初提出的PageRank算法解决了网页排名问题,在一定程度上奠定了实用的现代信息搜索产业的基础,单说最近比较热门的、跟大家生活工作密切相关的云计算和大数据,其成功应用和深入研究,正是以Google的研究成果为基础的。2003年,Google在19th ACM Symposium on Operating Systems Principles (SOSP‘03)上发表论文,提出了Google File System(GFS)[1],用以支持以搜索引擎为典型实例的大规模、分布式、数据密集应用,解决了海量数据的底层存储和检索问题。2004年,Google接着在6th Symposium on Operating Systems Design & Implementation (OSDI 2004)上发表论文,提出了MapReduce计算架构及其实现[2],解决了海量数据的分布式计算处理问题。2006年,Google又在OSDI 2006上发表论文,提出了Bigtable架构及其实现[3],解决了海量数据,尤其是海量超链接数据的结构化存储和检索问题。
[1] Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung. 2003. The Google file system. SIGOPS Oper. Syst. Rev. 37, 5 (October 2003), 29-43. gfs-sosp2003[1].pdf
[2] Jeffrey Dean and Sanjay Ghemawat. MapReduce: Simplied Data Processing on Large Clusters. In OSDI 2004.mapreduce-osdi04[1].pdf
[3] D. A., BURROWS, M., CHANDRA, T., FIKES, A., AND GRUBER, R. E. Bigtable: A distributed storage system for structured data. In 7th OSDI (Nov. 2006), pp. 205–218.bigtable-osdi06[1].pdf