.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

※ 参考:分散処理 > プロダクト

Hadoop MapReduce?

Hadoop YARN

アーキテクチャ

Hadoopは、以下の4つのモジュールによって構成されている。

Hadoop Common

他のモジュールから共通して利用されるライブラリ群。

Hadoop Distributed File System (HDFS)

HDFS:Hadoop独自の分散ファイル・システム。

NameNode?

マスターの役割を担当する。

DataNode?

スレーブの役割を担当する。

Hadoop Yet Another Resource Negotiator (YARN)

を担当。

課題

機能

Hadoop 1系までのMapReduceからクラスタのリソース管理、ジョブスケジューリングを分離したもの。

などの様々な分散処理フレームワークが動作する。

Hadoop MapReduce?

ファイル・システム

HDFS以外のファイル・システムもサポートしている。

MRv1

MapReduceエンジンはひとつのJobTrackerを持ち、
クライアントはこのJobTrackerに向けてMapReduceジョブを投入する。

MRv2

Hadoop MapReduceの管理コンポーネント

JobTracker?

旧マスタ(リソース管理、ジョブスケジューリング)ノード

TaskTracker?

旧スレーブ(割り当てられた処理の実行)ノード

ResourceManager?

投入されたMapReduceジョブを管理するノード。

NodeManager?

MapReduce用に特化したスロットではなく、
より汎用化したコンテナ単位でリソースを割り当てる。

ApplicationMaster?

MapReduceを含む各アプリケーション用に
それぞれ専用のApplicationMaster?が実行される。

エコシステム

分散処理フレームワーク

分散処理エンジン

分散ストリーム処理

DWH、データストア

Apache Hive(DWH)

Apache Impala(DWH)

HBase、Kudu

Asakusa Framework

ノーチラス・テクノロジーズが開発した、
Hadoop用の開発・運用フレームワーク。

参考

Wikipedia

MapReduce?

Google File System(GFS)

gihyo.jp … 技術評論社

Hadoopはどのように動くのか

Hadoopの設計と実装~並列データ処理系Hadoop MapReduce?

計算機クラスタのためのリソース管理基盤 Hadoop YARN

Hadoopの歴史


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS