多数のサーバで構成された大規模な分散ファイル
システム機能を提供し、MapReduceによる大規模
データの分散処理を実現するOSSはどれか。
ア Apache Hadoop
イ Apache Kafka
ウ Apache Spark
エ Apache Storm
ア 正しい。Hadoopは、大規模なデータを分散処理するための
オープンソースのソフトウェアライブラリである。
MapReduceは、Map処理 (入力データの読み込みと情報抽出) と
Reduce処理 (抽出情報の整理と主力) の2段階で大規模データの
分散処理を行うプログラミングモデルである。
イ Kafkaは、分散メッセージングシステムを実現するOSSである。
ウ Sparkは、大規模データを高速に分散処理するオープンソースのフレームワークである。
エ Stormは、リアルタイムに発生する大規模データを高速に分散処理するオープンソースの
フレームワークである。 異常検出や不正検出などに適している。
EXCEL VBAのご相談なら ファーストマクロ へ
タグ:分散ファイル