オープンソースカンファレンス2016.Enterprise@Osaka
2016-01-29 (金)   15時10分

Apache Hadoopによる並列分散処理入門

このエントリーをはてなブックマークに追加

講師:佐々木 徹
担当:株式会社NTTデータ
レベル:入門編
対象者:DBMSでは扱いきれない大量・多件数データに対してバッチ・リアルタイム問わず処理を実現したい方
前提知識:特になし(DBMSやHadoopでの処理、データ分析について経験・理解があるとなお良いです)

大量データに対する処理基盤として、Apache Hadoopが登場して10年になります。
この10年の間にHadoopは多くのシステムで利用されるようになり、それに伴い新たな
機能の追加等も順次行われてきました。
本セッションではHadoopの基本知識のほか、Hadoop上で動かすアプリケーションの1つ
であるMapReduceと最新のApache Sparkの概要をお話しします。

【カテゴリ】データベース/クラウド/Linux