2020年10月09日

令和元年度 技術士第一次試験問題(再) 情報工学部門 V−9

V−9

大規模データの分散処理技術であるHadoopに関する次の記述のうち、最も適切なものはどれか。

@ Hadoopで使用する分散ファイルシステムHDFSは、大きなファイルへのシーケンシャルアクセスに適している。

A Hadoopの処理系であるMapReduceの性能向上は、サーバ1台あたりの処理能力を 向上させるスケールアップを前提としている。

B MapReduceのマスターサーバをNameNodeと呼び、HDFSのマスターサーバを DataNodeと呼ぶ。

C 処理するデータは事前に定義された構造に従って正規化されている必要がある。

D リレーショナルデータベース管理システム (RDBMS) に比較してレスポンスタイムが小さいため、オンライン処理に適している。





正解

@


解説

@ 正しい。Hadoopは、大規模なデータを分散処理するためのオープンソースのソフトウェアライブラリである。
なお、HDFSは Hadoop Distributed File System の略である。

A MapReduceの性能向上は、サーバ1台あたりの処理能力を 向上させるスケールアップを前提としていない。サーバの台数を増やして負荷分散することによって、サーバ群としての処理能力を向上させるスケールアウトを前提としている。

B Hadoopはマスタースレーブ型の構成であり、マスターの役割をするのが、NameNode、マスター機の制御下で動作するスレーブの役割をするのが、複数のDataNodeである。

C データは正規化されている必要はない。そもそもHadoopはデータの更新ができない。

D Hadoopはオンライン処理には適していない。バッチ処理である。

タグ:hadoop
posted by ファーストマクロ at 19:39| Comment(0) | R01技術士一次試験[再](情報工学)
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。