「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfrastructure.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。

-[[戻る>NoSQL]]
--[[Hadoop]]
--[[列(カラム)指向型>NoSQL - 列(カラム)指向型]]

*目次 [#vbadb3ee]
#contents

*概要 [#pd64b20a]
-Javaにより書かれている。
-Powerset社において自然言語処理を行うため、~
大規模データの処理プロジェクトとして始まった。

*詳細 [#m1630714]

**特徴 [#v5169424]
-オープンソースの、[[列(カラム)指向型>NoSQL - 列(カラム)指向型]]、分散データベース。[[HDFS>#l2a0cd99]]を活用する。
-ビッグデータに対してランダムなリアルタイムの読み書きアクセスを行う必要がある場合に使う。~
普通のハードウェアのクラスタ上で、数十億行 x 数百万列規模の超巨大テーブルを格納できる。

**機能 [#a578732d]
-[[HDFS>#l2a0cd99]]の上でGoogleのBigTableのような機能を提供する。~
[[MapReduce>Hadoop#l29e344a]]ジョブではなくデータベース上でリアルタイムに実行される。
[[MapReduce>Hadoop#b9ef92ab]]ジョブではなくデータベース上でリアルタイムに実行される。
--圧縮
--インメモリ処理
--各列毎にブルームフィルタ

-独自のメタデータリポジトリとカラム型ストレージレイアウトがある。
--テーブルは[[Hadoop]]上の[[MapReduce>Hadoop#l29e344a]]ジョブの入出力として機能
--テーブルは[[Hadoop]]上の[[MapReduce>Hadoop#b9ef92ab]]ジョブの入出力として機能
--Java APIのほか、REST、Avro、ThriftといったゲートウェイAPIを通じアクセス可能

-クエリ
--カスタム言語でパーサ、クエリプランナ、クエリ実行エンジンを利用できる。
--完全にACIDに準拠しておらず、複雑なアクセスパターン(結合など)は使用できない。
--近年ではパフォーマンスが向上し、データ駆動型のWebサイトでも使用されている。

*参考 [#bd6e8dee]
-Apache HBase - Wikipedia~
https://ja.wikipedia.org/wiki/Apache_HBase

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS