.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

Apache Hadoopは

アーキテクチャ

Hadoopは、以下の4つのモジュールによって構成されている。

Hadoop Common

他のモジュールから共通して利用されるライブラリ群。

Hadoop Distributed File System (HDFS)

HDFS:Hadoop独自の分散ファイル・システム。

NameNode?

マスターの役割を担当する。

DataNode?

スレーブの役割を担当する。

Hadoop Yet Another Resource Negotiator (YARN)

Hadoopクラスタのリソース管理、ジョブスケジューリングを担当。Hadoop 2.2から利用可能。

課題

機能

Hadoop 1系までのMapReduceからクラスタのリソース管理、ジョブスケジューリングを分離したもの。

などの様々な分散処理フレームワークが動作する。

Hadoop MapReduce?

ファイル・システム

HDFS以外のファイル・システムもサポートしている。

MRv1

MapReduceエンジンはひとつのJobTrackerを持ち、クライアントはこのJobTrackerに向けてMapReduceジョブを投入する。

MRv2

Hadoop MapReduceの管理コンポーネント

JobTracker?

旧マスタ(リソース管理、ジョブスケジューリング)ノード

TaskTracker?

旧スレーブ(割り当てられた処理の実行)ノード

ResourceManager?

投入されたMapReduceジョブを管理するノード。

NodeManager?

ApplicationMaster?

MapReduceを含む各アプリケーション用にそれぞれ専用のApplicationMaster?が実行される。

エコシステム

分散処理フレームワーク

分散処理エンジン

分散ストリーム処理

DWH、データストア

Apache Hive(DWH)

Apache Impala(DWH)

HBase、Kudu(データストア)

Asakusa Framework

ノーチラス・テクノロジーズが開発した、
Hadoop用の開発・運用フレームワーク。

歴史

参考

参考

MapReduce?

Google File System(GFS)

gihyo.jp … 技術評論社

Hadoopはどのように動くのか


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS