「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfrastructure.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。 -[[戻る>ビッグデータ]] *目次 [#m73758a2] #contents *概要 [#m59dcae8] NoSQLに関する情報をまとめる。 **背景 [#ya76316d] 登場の背景はRDBでは解決困難な[[3Vの増加の問題>ビッグデータ#wecdc89e]]がでてきたから。 ***Volume & Velocity [#mfacfc80] RDBで、大量データの高速処理を行う場合の課題として、 -[[スケールアウトが困難>http://techinfoofmicrosofttech.osscons.jp/index.php?%E5%A4%A7%E9%87%8F%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E5%87%A6%E7%90%86%E6%96%B9%E5%BC%8F3#u1ee768f]] -スケールアップしか無い という点があげられる。 ***Variety [#h5276ccd] -非定型なメタデータの管理が困難 -RDBに格納困難な[[非構造化データ>https://ja.wikipedia.org/wiki/%E9%9D%9E%E6%A7%8B%E9%80%A0%E5%8C%96%E3%83%87%E3%83%BC%E3%82%BF]]が増加しているらしい(主にはJSON)。 **適合するケース [#ec214165] ***非構造化データ [#d2c12f43] -非構造化データの例 --商品情報 --物件情報 --デバイスの生成するデータ --最近、非構造化データが急増している。 -非構造化データの増加に伴う影響 --スキーマ変更の影響が大きい(多分、主に列を足す作業) ---時間がかかる ---オフライン ***大量データの高速処理 [#v3a2f69c] -原因 --モバイル端末からのアクセス数の増加。 -対応~ RDBでは、 --スケールアップが限界を迎える(若しくは高価過ぎる)。 --しかし、スケールアウトにも課題がある。 --そこで、スケールアウト可能なNoSQLが採用される。 --減らせるRDBの運用コスト > NoSQLクラスタの運用コスト *詳細 [#wb232d82] **プロダクトのタイプ [#rf480bb4] [[データ・パイプラインの構成を理解するのに重要になりそう。>データ・パイプライン#c0ac8f8b]] ***[[分散処理]] [#y1a1fd04] バッチ型とストリーム型がある。 ***[[KVS型>NoSQL - KVS型]] [#b2f6dc29] -KVS型~ Hibari、Dynamo、Voldemort、Riak -KVSイネーブラ型~ Memcached、Redis、Scalaris、Tokyo Cabinet/Tyrant ***[[列(カラム)指向型>NoSQL - 列(カラム)指向型]] [#a424896e] -ビッグデータ型 --インメモリDB~ ---SAP HANA ---各RDBMSのオプション --分散クエリ ---BigQuery、Dremel ---Dremel~ ・[[Apache Drill]]~ ・BigQuery ---Amazon Redshift -NoSQL型 --[[Apache HBase]] --[[Apache Kudu]] --Apache [[Cassandra]] ***[[ドキュメント指向型>NoSQL - ドキュメント指向型]] [#j7b51bce] ***[[グラフ型>NoSQL - グラフ型]] [#w65a27de] ***[[時系列型>NoSQL - 時系列型]] [#s7c22048] ***[[HTAP (Hybrid Transaction/Analytical Processing)>NoSQL - HTAP]] [#i2013d6c] *参考 [#q950dabd] -NoSQL - Wikipedia~ https://ja.wikipedia.org/wiki/NoSQL -データベース部会 設立セミナー~ NoSQLの必要性と主要プロダクト比較~ http://openstandia.jp/event/pdf/20150828oss_con_report.pdf?osscon0828 **@IT [#i90bf7d3] -知らないなんて言えないNoSQLまとめ~ https://www.atmarkit.co.jp/ait/series/928/ --(1):KVS系NoSQLのまとめ(Hibari、Dynamo、Voldemort、Riak編) --(2):イネーブラ型NoSQLのまとめ(Memcached、Redis、Scalaris、Tokyo Cabinet/Tyrant編) --(3):カラム指向型データベース(HBase、Hypertable、Cassandra)編 --(4):グラフ型NoSQLデータベース(Neo4j、InfiniteGraph)編 --(5):ドキュメント指向のNoSQLデータベース(CouchDB、MongoDB)編 **Think IT [#le120891] -ドキュメント指向データベースと列指向データベース~ https://thinkit.co.jp/story/2010/10/15/1798 **Qiita [#x9745f5d] -OSSデータベース調査 NoSQLデータベース編~ https://qiita.com/kanegoon/items/5ade64336d389feea4bc -各種DBシステムの概要 RDBMSとNoSQL~ https://qiita.com/yk-nakamura/items/5022f51ffc39e4a8c412 -最近よく聞くQuorumは過半数(多数決)~ よりも一般的でパワフルな概念だった~ https://qiita.com/everpeace/items/632831371da5ff215995 **昨今のトレンド [#r3cc312e] NoSQLはOSSよりサービスのほうが流行っている感ある。 -ニュース解説 - AWSとAzure、戦いの舞台はNoSQLへ:ITpro~ http://itpro.nikkeibp.co.jp/atcl/column/14/346926/062801035/ -株式会社INTHEFOREST、パブリッククラウド(Microsoft Azure向け)~ Cassandraフルマネージドサービス開始|株式会社INTHEFORESTのプレスリリース~ https://prtimes.jp/main/html/rd/p/000000002.000003858.html なお、API互換性は探したが発見できず(有識者曰く互換性は無さそう)。