CDH5 beta2とClodueraManager5 beta2をセットアップしてみた

CDH5 beta2とClodueraManager5をCentOS6にセットアップしてみたのでメモやら雑感。

ClodueraManager5のパッケージリポジトリ

http://archive.cloudera.com/cm5/
yumで使うなら以下。

# curl http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/cloudera-manager.repo > /etc/yum.repos.d/cm5.repo

ClouderaManager5のインストール

CM4と手順は一緒っぽい。cloudera-manager-serverが本体、組み込みのDB(postgresql)を使うならcloudera-manager-server-db-2を使えば簡単 。ちょっとパッケージ名が変わったのかな。

クラスタのセットアップ

CM4の時と手順はほぼ変わらず。パーセルにCDH5を選ぶと、ImpalaやSparkは別途インストールする必要はない。
パーセルでインストールするとJDKは1.7になるようだ。

UI

CM4のときと見た目はがらっと変わってるが、メニュー等の配置は大きくは変わってないのかな。

サービスの追加はホーム画面のプルダウンメニューになってた。

雑感

セットアップなどはCDH4/CM4のときとあんまり変わらなさそうなのですぐに使えそう。
HDFSNFSマウントうれしい。YARNを使って各アプリを動かすのも本格的にできるみたいだし、ImpalaやSparkなどがどうなってるのか知っておきたいところ。