.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

データ・パイプライン...まさに配管。

v1

取り敢えず書いてみた、最初の版。

イメージ

v2

Databricksのセミナーに影響を受けた結果を反映。

イメージ

DXは=IoT, ビッグデータ分散処理), AIじゃねーよ。
みたいな話があったりしましたが、まぁ、ワリと、
IoT, ビッグデータ分散処理), AIになってしまってます♨。

まぁ、技術マッピング中に含まれているから良いのでは?と。

v3

Path(Hot、Warm、Cold)

認証について

監視 → 制御へ。

詳細

データ収集(データ転送)

バルク型(bulk)

分散(バッチ)処理

ストリーミング型(streaming)

ストリーム処理

データレイクデータマート

データマート

データレイク

ワークフロー管理ツール

前述の、データレイク → データマートの処理をワークフロー化する。

データ集約プロセス

可視化プロセス

エンジニア、アナリスト

データ エンジニア

データの設計や統合、クレンジングの仕組み、カタログの整備。

データベース エンジニア

データ基盤のインフラ・アーキテクチャを設計し、安定して運用する。

データ アナリスト

データから価値ある情報を引き出す。

参考

Qiita

NiFi, Kafka, Storm

Elastic Stack

Elastic Stackは、1つの完成された事例的。

NoSQLプロダクトのタイプ

ビッグデータ界隈のシステムにおいて、

DWHとは異なる。

業務データを長期的に蓄積し管理したもの(なので、バッチ的アーキテクチャである)。

イベント駆動型である。

業務データではなく、様々なデータソースから発生するデータを対象にする。

Databricksのレイクハウス


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS