.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

Apache Hadoopは

アーキテクチャ

Hadoopは、以下の4つのモジュールによって構成されている。

Hadoop Common

他のモジュールから共通して利用されるライブラリ群。

Hadoop Distributed File System (HDFS)

HDFS:Hadoop独自の分散ファイル・システム。

NameNode?

マスターの役割を担当する。

DataNode?

スレーブの役割を担当する。

Hadoop Yet Another Resource Negotiator (YARN)

Hadoopクラスタのリソース管理、ジョブスケジューリングを担当。Hadoop 2.2から利用可能。

課題

機能

Hadoop 1系までのMapReduceからクラスタのリソース管理、ジョブスケジューリングを分離したもの。

などの様々な分散処理フレームワークが動作する。

Hadoop MapReduce?

ファイル・システム

HDFS以外のファイル・システムもサポートしている。

MRv1

MapReduceエンジンはひとつのJobTrackerを持ち、クライアントはこのJobTrackerに向けてMapReduceジョブを投入する。

MRv2

Hadoop MapReduceの管理コンポーネント

JobTracker?

旧マスタ(リソース管理、ジョブスケジューリング)ノード

TaskTracker?

旧スレーブ(割り当てられた処理の実行)ノード

ResourceManager?

投入されたMapReduceジョブを管理するノード。

NodeManager?

ApplicationMaster?

MapReduceを含む各アプリケーション用にそれぞれ専用のApplicationMaster?が実行される。

エコシステム

分散処理フレームワーク

分散処理エンジン

分散ストリーム処理

Apache HBase

概要

機能

参考

Apache Hive

概要

Hadoopの上に構築されたデータウェアハウス 構築環境

機能

データウェアハウススタイルのバッチ分析ワークロードを処理する機能。

コンポーネント

以下の5つの主要コンポーネントで構成されている。

参考

Apache Kudu

HDFSHBaseの長年のギャップを埋める

Asakusa Framework

ノーチラス・テクノロジーズが開発した、Hadoop用の開発・運用フレームワーク

参考

MapReduce?

Google File System(GFS)


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS