新書推薦:

《
折姜(中)
》
售價:HK$
51.5

《
清华大学藏战国竹简校释(伍):《筮法》诸篇
》
售價:HK$
107.8

《
我们都会变有钱:投资的道与术
》
售價:HK$
63.8

《
人体使用指南:没有什么比身体更重要
》
售價:HK$
92.0

《
黄土馆事件
》
售價:HK$
80.2

《
“一国两制”下香港维护国家安全的实践(16开本繁体字版)
》
售價:HK$
18.9

《
2025年《咬文嚼字》合订本(平)
》
售價:HK$
93.2

《
土地:对所有权的渴求如何塑造现代世界
》
售價:HK$
80.2
|
| 內容簡介: |
准备好释放数据的威力了吗?通过这本《Hadoop**指南影印版第4版修订版英文版》,你将会学习到如何通过ApacheHadoop建立和维护可靠的、可扩展的分布式系统。本书是期望分析任意大小的数据集的程序员以及想建立和运行Hadoop集群的管理员的理想选择。
在这本面向Hadoop2的新版书籍中,作者怀特增加了关于YARN和一些Hadoop相关项目,如Parquet、Flume、Crunch和Spark的新章节。你将会了解到Hadoop版本的*新变化,并且研究在医疗健康系统和基因数据处理中Hadoop的应用案例。
|
| 關於作者: |
|
怀特,TomWhite是Cloudera的工程师和Apache软件基金会的成员,从2007年起就是ApacheHadoop的代码提交者。他在oreilly.com、java.net和IBM的developerWorks写了大量文章,并且经常在产业大会上作关于Hadoop的演讲。
|
| 目錄:
|
Foreword
Preface
Part Ⅰ.HadoopFundamentals
1.Meet Hadoop
2.MapReduce
3.The Hadoop Distributed Filesystem
4.YARN
5.Hadoop IO
Part Ⅱ.MapReduce
6.Developing a MapReduce Application
7.How MapReduce Works
8.MapReduce Types and Formats
9.MapReduce Features
Part Ⅲ.HadoopOperations
10.Setting Up a Hadoop Cluster
11.Adminstering Hadoop
Part Ⅳ.Related Projects
12.Avro
13.Parquet
14.Flume
15.Sqoop
16.Pig
17.Hive
18.Crunch
19.Spark
20.HBase
21.ZooKeeper
Part Ⅴ.Case Studies
22.Composable Data at Cerner.
23.Biological Data Science: Saving Lives with Software
24.Cascading
A.Installing Apache Hadoop
B.Cloudera''s Distribution Including Apache Hadoop
C.Preparing the NCDC Weather Data
D.The Old and New Java MapReduce APIs
Index
|
|