SOCKSプロキシー

Clouderaは、クラスターへの接続にSOCKSプロキシーサーバーを利用することをおすすめしています。SOCKSプロキシーサーバーを使うことで、クライアントは直接セキュアにサーバーに接続でき、そこから同じサブネット内の他のIPアドレスやポートのサーバーに接続できます。たとえば、SOCKSプロキシーサーバーを使うことで、ブラウザーはセキュアにCloudera Managerの管理画面に接続し、さらには同じサブネットにあるYARN History ServerやSpark History Serverにも接続できます。

会社のVPNに接続されているサブネットを使う場合、Cloudera ManagerのプライベートIPアドレスを通じて直接クラスターに接続できます。ただし、もしもDNSのドメイン名の解決が適切に設定されていなければ、シームレスにそれぞれのWebインターフェースに接続していくことはできないかもしれません。そういった場合には、ClouderaとしてはSOCKSプロキシーをVPNトンネルが存在していないかのようにセットアップすることをおすすめします。そうすれば、ブラウザーはDNSの解決をSOCKSの接続を通じてフォワードするようになります。

Cloudera ManagerをホストしているEC2インスタンスにアクセスするために、AltusクライアントでSOCKSプロキシーサーバーをセットアップすることができます。ブラウザーとしてChromeを使っているのであれば、ChromeでCloudera Managerを開くためのパラメーターをコマンドに含めることができます。SOCKSプロキシーでの接続に慣れているなら、SSHコマンドを使って手作業でサーバーをセットアップすることもできます。

SOCKSプロキシーをセットアップする際には、AWSアカウント内のAltusクラスターのEC2インスタンスに関連づけられているセキュリティグループに、適切なIPアドレスを追加しなければなりません。

Altusと使うSOCKSプロキシーサーバーをセットアップするには、以下のようにします。
  1. AWSアカウント内のクラスターに関連づけられたセキュリティグループを設定し、SOCKSプロキー経由での接続を許可します。
  2. SOCKSプロキシーをセットアップします。

    SOCKSプロキシーのセットアップには、Altusクライアントのコマンドか、SSHのコマンドを使ってください。

SOCKSプロキシー接続を許可するためのセキュリティグループの設定

セキュリティグループは、EC2インスタンスへの接続をコントロールします。SOCKSプロキシーからAltusクラスターへの接続を許可するには、Altusクラスターに関連づけられたセキュリティグループにルールをセットアップしなければなりません。

SOCKSプロキーのクラスターへの接続を許可するようセキュリティグループを設定する二は、以下のようにします。
  1. AWSコンソールで、VPC > Security Groupsと進み、Altus Environment 用に作成されたセキュリティグループを見つけてください。

    正しいリージョンを見ていることを確認してください。

  2. Inbound Rulesタブを選択し、セキュリティグループを編集してSSHという種類のルールを追加してください。
  3. ポート番号を22に設定してください。
  4. Sourceプロパティを、接続元となるIPアドレスもしくはIPアドレスの範囲に設定してください。

    自分のIPが分からない場合は、リストから My IPを選択してください。

  5. ルールを保存してください。

Altusクライアントを使ったSOCKSプロキシーのセットアップ

Cloudera ManagerをホストしているEC2インスタンスにアクセスするために、コマンドを実行してSOCKSプロキシーサーバーをセットアップする場合、直接ChromeブラウザーでCloudera Managerを開くように指定することもできます。

Cloudera ManagerへのSOCKSプロキシー接続をセットアップするには、以下のコマンドを使います。

altus dataeng socks-proxy --cluster-name <name-of-your-cluster> --ssh-private-key <path-and-file-of-your-private-key>

Google Chromeブラウザーで直接Cloudera Managerを開くには、以下のパラメーターを追加してください。

--open-cloudera-manager yes

このコマンドは、プロキシーサーバーへの接続に1080番ポートを使います。