Cloudera QuickStart VMを使ってImpalaを試してみる

HDFSやHive、Impalaなど、Hadoop関連のソフトウェアやCloudera Managerの動作やをちょっと見てみたい、という場合、Clouderaが公開しているCloudera QuickStart VMを使うと良い。
https://ccp.cloudera.com/display/SUPPORT/Cloudera+QuickStart+VM
VMWareKVMVirtualBox用のVMイメージが公開されている。
試したのはVMWare用のVMイメージ。メモリが4GB程度ないと重いので注意。
OVF形式なので、Windows上でVMWarePlayerで開くとインポートのダイアログが表示される。
インポートしてVMを起動すると、CentOSが立ち上がり、Firefoxでようこそ画面が表示される。

Impalaを試す場合、ブックマークのCloudera Managerを開き、Impalaのサービスをアクティブにする。

デスクトップ上でターミナルを開いても良いが、clouderaという名前のユーザーでログインしているので、SSHの公開鍵を設定してPuTTYからつないで使うのが個人的には楽かな。

Impalaのチュートリアルを動かしてみる

HDFSはデフォルトで起動されているので、Impalaのチュートリアルをすぐに動かせる。
Impala Tutorial
impala-shellコマンドを起動するとlocalhostにつながるので、すぐにクエリを投げて結果を見れる。

開発用に使うのでも便利そうですな。