Hadoop >

Oozie とは

  • はじめに米Yahoo! で開発、運用されていたオープンソースの Apache Hadoop 向けジョブワークフローおよびコーディネータエンジンです。エンタープライズ向けの Hadoop 運用では重要なインフラと言えます。現在は、Apacheのプロジェクトとして開発がすすめられています。
  • HDFSへの操作、Pigスクリプトの実行そしてMap/Reduce処理を含めた複雑なジョブの実行を管理することが可能です。
  • oozie とはビルマでの象使いの呼び名らしいです*1mahout もインドの象使いのことを指しますが、こちらの Apache Mahout は、機械学習ライブラリですね。

ディストリビューション

Apache Oozie

Yahoo! 公式サイト配布版(古い初期バージョンのみ)

Cloudera配布版

  • Cloudera's Distribution for Hadoop Ver. 3 (CDH3) から Oozie が含まれるようになりました。
  • バイナリ配布なので、セットアップが容易です。
  • インストール方法

スクリーンショット

リソース


*1 http://en.wikipedia.org/wiki/Oozie

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2013-01-15 (火) 19:41:36 (2157d)