1:SX-Aurora TSUBASA にCentOSを導入し、関連ツールとライセンスを設定するまで 【SXAT-Setup1】 †【AboutNecSXAT に戻る】【2:SXAT-CCXbuild1 に進む】【3:SXAT-PrePoMax1 に進む】【4:SXAT-PrePoMax2 に進む】 ここでは、研究室でSXATを導入する時に行った作業の記録をまとめます。まず必要なのは、上記の関連文書ウエブにある「SX-Aurora TSUBASA セットアップガイド」 次に必要なのは、SXATの独自のソフトウエアを導入するために、上記の関連文書ウエブにある「SX-Aurora TSUBASA インストレーションガイド」 更に必要なのは、SXATのソフトウエアのラインセンスを管理するために、上記の関連文書ウエブにある「HPC ソフトウェアライセンス管理説明書」 必要なものは「セットアップガイド」の P.1「第1章 準備」にあります。 なお「セットアップガイド」では、OSの必要なパッケージをインストールDVDから取得したり、ダウンロードは別のWindows-PCを利用していますが、以下の資料では、なるべくSXATのみを使って進めたいと思います。 ハードウエアに関する情報 †今回活用するのは、「エッジモデル:A100-1」と呼ばれる、PCサイズのスパコンになります。見た目は以下の左側の写真のように、ちょっと大きなパソコンぐらいで、手前に置いたDVDメディアで大きさがわかると思いますが、寸法は20x43x53cmで「ミドルタワーサイズ」になります。 中央の写真の下にある、赤いグラフィックボードみたいなのが、このSXATの心臓部になる「ベクトルエンジン」になります。この高速ベクトル演算用ボードが組み込まれた形の製品になっています。マザーボードとかは一般的なPCサーバーの形式で、プロセッサやメモリがあります。 右側の写真では、端子の接続パネルですが、グラフィックは標準的なDsubで、キーボードやマウスはUSB接続します。注意するのは、LAN端子が2つあるのですが、この活用では左側(ボード側)に接続することにします。電源も普通の100Vですから、どこでも設置できます。以上の接続を準備しておきます。 以上の内容の詳細は、「セットアップガイド」の P.5「第2章 ハードウェアのセットアップ」にあります。 この検証で利用するハードウエア「A100-1」に関しては、https://jpn.nec.com/press/201710/images/2501-01-01.pdf にまとめてあり、PC本体を「VH:ベクトルホスト」、高速演算ボードを「VE:ベクトルエンジン」と呼びます。 ベクトルホスト(VH)の仕様は、以下の通りです。 ベクトルエンジン(VE)の仕様は、以下の通りです。 なお最新版のハードウエア情報は、以下にまとめてありました。 https://jpn.nec.com/hpc/sxauroratsubasa/specification/index.html?#anc-spec01 ソフトウエアに関する情報 †今回はSXATの活用において、無償で利用できるCentOS7.7を用いることにしました。以下のウエブは「Index of /centos/7.7.1908/isos/x86_64」となっており、ここで「CentOS-7-x86_64-DVD-1908.iso (11-Sep-2019/11:51/4.3G)」をダウンロードします。DVDサイズのISOイメージファイルなので、4.3GBまであってダウンロードに時間がかかります。このISOイメージファイルを用いて、インストール用DVDを作成します。単にISOファイルを保存するのではなく、ISOイメージから起動できる様にDVDを作成します。 http://mirrors.oit.uci.edu/centos/7.7.1908/isos/x86_64/ なお最新版のLinuxカーネル情報は、以下にまとめてありました。 https://www.support.nec.co.jp/View.aspx?id=3140106285 以下の内容の詳細は、「セットアップガイド」の P.8-21「第3章 OSインストール」にあります。 ただし、セットアップガイドの手順では、導入後にコンソール画面で作業しますが、以下の手順では様々な応用を展開するために、グラフィック画面を利用する設定となっています。また以下の導入の手順では、ディスク・メディア・ネットワークの扱い方が異なっていますが、この資料では資料を参考にしながらも、この手順で進めることにします。また、P.22-23の作業は、後で必要になったときに行います。
この段階で、デスクトップ上で右クリックして「端末を開く」で、「$ cat /etc/redhat-release」のコマンドでバージョン「CentOS Linux release 7.7.1908 (Core) 」を確認できます。SXATを活用するために、動作確認が取れているこのバージョンで進めます。(システム更新は行わずに進めます) SXAT用ソフトの導入の準備 †以下の内容の詳細は、「インストレーションガイド」の P.1-10「第1章 はじめに」にあります。 ここからは、準備したSXATのCentOS7.7に対して、必要なソフトウエアやライセンスの導入の準備をします。 まず、SXAT用ソフトを導入するために、独自の用語を確認しておくので、「インストレーションガイド」の P.ii-iiiの「用語定義・略語」を読んでおきます。 なお今回の導入では、PPサポートありとして進めます。また検証用機器は、LAN接続しインターネットにアクセス可能としています。 次に、「インストレーションガイド」を見て、導入に必要な情報を確認します。 P.1 「1.1 本書が対象とするソフトウェア」: SXATの活用に必要なソフトウエアの一覧を確認します。 図7のフローの分岐において、InfiniBandは用いず(2.3なし)、インターネット接続可能(A.1-A.2なし)、ScaTeFSを使わない(2.8なし)、とするので、真っ直ぐに下に向かう手順です。 SXAT用ソフトのインストール †以下の内容の詳細は、「インストレーションガイド」の P.11-17「第2章 インストール(PPサポート契約あり)」にあります。 なお以下のインストールでは、システム管理者として、スーパーユーザー(root)で実行する必要がありますが、ここでは利用者を管理者とする設定をしているので、sudo を用います。
先の手順によって、CentOS 7.7 が導入済みです。ただし、CentOSの場合には、「SX-Aurora TSUBASAの性能を引き出すためには、以下のようにチューニングプロファイルを変更する必要があります。」とのことなので、以下のように設定します。 $ sudo tuned-adm profile throughput-performance
以上で導入したCentOS 7.7 のカーネルのバージョンを、「コマンド:uname -r」で確認すると、「3.10.0-1062.el7.x86_64」でした。「インストレーションガイド」のP.12の「【SX-Aurora TSUBASA】検証済み Linux カーネル」のリンクを見ると、以下の3種類が動作確認済みカーネルとなっているので、カーネルバージョンアップを適切に実行してください。 3.10.0-1062.18.1.el7.x86_64 / 3.10.0-1062.12.1.el7.x86_64 / 3.10.0-1062.4.1.el7.x86_64 この検証済みカーネルがアップデートしないように、sudo vi /etc/yum.conf として設定します。ファイルを開いたら、[main]の設定の最後に、「exclude=kernel*」を追加します。
SX-Aurora TSUBASA システムの実行環境である VH に必要なソフトウェアのインストールを行うため、yum リポジトリを設定します。 まず、リポジトリ追加用ファイルを、以下のコマンドで導入します。 インストール:TSUBASA-soft-release.oarch 0:2.1-1 「完了しました!」で終了。インストール内容として、以下のコマンドでファイルを確認できます。 この中で優勝リポジトリ設定ファイルの中に、sudo vi /etc/yum.repos.d/TSUBASA-restricted.repo で、準備した情報を設定します。
この作業は、ガイドに従って root になって、プロンプト # になってから実行してみます。「su / (root-password)」 ここでは、実行と開発の両方を行う設定で、infiniband, nqsv, scatefs を利用しない設定として、インストール項目を以下のように設定します。 # TSUBASA_GROUPS="ve-devel nec-sdk-devel nec-mpi-devel" グループ状態更新スクリプト TSUBASA-groups-remark.sh を用いて、次のように設定します。 # /opt/nec/ve/sbin/TSUBASA-groups-remark.sh $TSUBASA_GROUPS 実際に yum を用いて、次の手順でインストールします。 # yum groups install $TSUBASA_GROUPS 「インストール容量;3.7G」となり、インストール確認 y で進める 全部で99個パッケージを導入します。
導入したSXAT用のインストールによって、vecmd コマンドでVEが ONLINE であることを確認します。インストールしてから数分待って行います。 # /opt/nec/ve/bin/vecmd state get
次に VMC(VE管理コントローラー:VE Management Controller)の更新の要否を、次のコマンドで判定します。(ここも root でコマンドを実行) # /opt/nec/ve/bin/vecmd fwup check (1) VEの状態をMAINTENANCEモードにします。 # /opt/nec/ve/bin/vecmd state set off 「Result: Success」と出て終了 / # /opt/nec/ve/bin/vecmd state set mnt 「Result: Success」と出て終了 (2) vecmdコマンドを実行し、ファームウェアをアップデートします。 # /opt/nec/ve/bin/vecmd fwup vmc aurora_MK10.bin 「It takes time. Please wait a moment.」と表示されるので数分間待つ。 (3) VEの状態を確認します。 # /opt/nec/ve/bin/vecmd state get 「Result: Success」と出て認識は確認 / # /opt/nec/ve/bin/vecmd fwup check 「Updating VMCFW is not required.」と出て更新も確認 SXAT用ソフトのライセンス設定 †以下の内容の詳細は、「HPC ソフトウェアライセンス管理説明書」にあります。 まず P.5 の「1.4. 対象製品」において、設定するライセンスを確認します。次に P.6 の「1.6. ライセンスを使用するための手順」において手順を確認し、P.7の「2. ライセンスの管理方法について」を確認しておきます。 なお以下の手順では、P.9の「3. ライセンスファイルの入手」と P.11の「4. ライセンスサーバー、ライセンスアクセスライブラリの入手」は、対応済とします。 それでは、P.12の「5. ライセンスサーバーのインストール・環境設定」を実行します。まず「5.1. ライセンスサーバーのインストール」は、対応済みで不要です。 「5.2. ライセンスファイルの配置」を行います。準備したライセンスファイル license.dat を /opt/nec/aur_license ディレクトリの下に配置します。root としてライセンスファイルがあるディレクトリで、以下のコマンドを実行します。 # cp license.dat /opt/nec/aur_license (正常終了すると出力なし) 「5.3. ライセンス発行キーの登録」を行います。準備したライセンス発行キーをライセンスサーバーに登録します。root として /opt/nec/aur_license/bin/reg_serialkey コマンドで、以下のように、ライセンス発行キーを一つずつ指定して登録します。 # /opt/nec/aur_license/bin/reg_serialkey NNNNNN-NNNNNN-NNNNNN-NNNNNN-NNNNNN 用意したすべてのライセンス発行キーを登録したら、次のコマンドで登録が正常に行えているか確認をします。問題なく登録が行えている場合「OK」が表示されます。 # /opt/nec/aur_license/bin/reg_serialkey -—check 「5.4. ライセンスサーバーの設定」を行います。環境設定は、/opt/nec/aur_license/aur_license.conf ファイルを、root で所定のとおり編集します。今回は、License_server_port と License_server_host の2項目を記述し、他の3項目は既定値です。 # vi /opt/nec/aur_license/aur_license.conf 「5.5. ファイアウォールの設定」を行います。ライセンスサーバーが上記の設定で指定した待ち受けポート番号で通信が行えるように、ファイアウォールの設定が必要です。以下の2つのコマンドで設定します。 # firewall-cmd --add-port=7300/tcp --permanent (「success」が表示される) # firewall-cmd --reload (「success」が表示される) 次に以上の準備を終えて、「6. ライセンスサーバーの運用」を行います。具体的には「6.1. ライセンスサーバーの起動、終了」を実行します。 まず、以下のコマンドで設定したライセンスサーバーを起動します。 # systemctl start aurlic-server.service (成功するとメッセージなし) 設定したライセンスサーバーの状況を、以下のコマンドで確認します。 # systemctl status aurlic-server.service (成功すると以下のメッセージ) 正常な動作を確認したら、再起動時にライセンスサーバーを自動的に起動できるように、以下で設定します。 # systemctl enable aurlic-server.service (成功すると以下のメッセージ) 【AboutNecSXAT に戻る】【2:SXAT-CCXbuild1 に進む】【3:SXAT-PrePoMax1 に進む】【4:SXAT-PrePoMax2 に進む】 |