ハンズオンに必要な環境のセットアップ方法を記載します。
Power BI Desktop は無料で利用できる可視化ツールです。
下記リンクより、Microsoft ストアから Windows アプリとしてインストールでできます。
http://aka.ms/pbidesktopstore
※ Widnowsストア経由でインストールされた Power BI Desktop は、自動更新機能によって常に最新バージョンをご利用になれます。
Azure Machine Learning service は機械学習のモデル学習、デプロイ、運用管理をサポートするクラウドベースの機械学習の統合プラットフォームです。
- Azure Portal へアクセスします。
- 画面左上のリソースの作成 を選択します。
- 検索バーにて、machine learning service workspace と入力します。
- Machine Learning service workspace を選択し、作成 をクリックします。
- 各種情報を入力します。
Item | Value |
---|---|
ワークスペース名 | 任意の3~33文字のアルファベット・数値とハイフンで Okay |
サブスクリプション | 利用するAzure Subscriptionを選択 |
リソースグループ | Azure ML 用に新規に作成することをオススメ |
場所 | 任意のRegion |
- 確認および作成 をクリックし、レビュー画面にて 作成 を選択します。
- 無事デプロイが完了したら、リソースに移動 します。
- Azure Machine Learning service ワークスペースの画面が表示されたら完了です。
- また、プレビュー中(2019年10月6日時点)のワークスペース画面にも、下記リンクからアクセスできることを確認してください。
New Workspace Experience
https://ml.azure.com/workspaceportal
機械学習のトレーニングを回すための計算環境 (Machine Learning Compute) を設定します。 Workspace の画面の左パネルの Compute から、計算環境を作成していきます。
Add して、新規で計算環境を構築します。
cpucluster という名称で、Compute Type は Machine Learning Compute を選択します。Machine Learning は機械学習用に Pre-Built された PaaS で提供される計算環境です。
※ VMも選択可能だが、スケールしないため通常は Machine Learning Compute を利用
VMの種類やノードの設定を行います。下記画面を参考に選択してください。設定が完了したら、Create を押して環境作成を開始します。
Item | Value |
---|---|
Virtual machine size | 4コア以上のマシンを推奨 |
Virtual machine priority | Dedicated |
Manimum number of nodes | 0 (Jobが無い時の稼働ノード数) |
Maximum number of nodes | 2 (最大稼働ノード数) |
Idle seconds before scale down | 300 (処理完了からスケールダウンを始めるまでの時間) |
※ Azure Subscription に紐づく Quota の範囲でご利用ください。
計算環境の作成が無事終わったことを確認します。
Python 環境としては、Notebook VM の利用を推奨しています。ただローカルPCの Python 環境からも Azure Machine Learning service にアクセスすることができます。A, B のいずれかの手順を実行してください。
Notebook VM は、 Azure Machine Learning service が提供するマネージドな Jupyter Notebook / Jupyter Lab 環境です。
自分の Notebook VM を作成する際は、左パネルの Notebook VM にアクセスし、Newをクリックします。
Item | Value |
---|---|
Notebook VM Name | Regionで一意となる名称が必要 |
VM Type | 任意のスペックから選択可能 (CPU,GPU)(4コア以上推奨) |
5分程待ちます。Status が Running になっていることを確認し、Jupyter をクリックして、Jupyter Notebook にアクセスできることが確認できれば完了です。
# New Conda
conda create -n myenv Python=3.6
# Activate
conda activate myenv
- Azure Machine Learning service Python SDK をインストールします。
# Package Install
pip install --upgrade azureml-sdk[notebooks,automl,explain,contrib] azureml-dataprep
- Jupyter Notebook をインストールし、カーネルを有効化します。
# Install Jupyer Notebook
conda install notebook ipykernel
# Jupyter Kernel Attach
python -m ipykernel install --user --name myenv --display-name myenv
# Start Jupyter Notebook
jupyter notebook
次の Python プログラムで正常に Azure Machine Learning service Python SDK がインポートできたか確認できれば完了です。
import azureml.core
azureml.core.VERSION
ハンズオンで利用するコードをインポートします。利用する Python 環境に応じて、A, B のいずれかの手順を実行してください。
Notebook VM には Git がインストール済みのため、その Git コマンドからインポートします。
Jupyter Notebook の Terminal を開きます。自分の個人フォルダーに移動し、本リポジトリをクローンします。
dir
cd <個人フォルダ>
git clone https://github.com/konabuta/DataExplore-Workshop
下記のいずれかの手順でローカルPCにコードをインポートします。
A. Git or GitHub Desktop がインストールされている場合は、Gitコマンドで本リポジトリをクローン
# git コマンドの例
git clone https://github.com/konabuta/DataExplore-Workshop
B. 本リポジトリの Zip ファイル をダウンロードし、ローカルPCの作業フォルダで解凍する
注意:ローカルPCの利用を推奨します。クラウド環境でも正常に動くように現在改善中です。
Microsoft Interpret ML のライブラリを利用する際には、Azure Machine Learning service とはパッケージの競合を防ぐため、Azure ML service Python SDK とは別の仮想環境を利用することを推奨します。
- Jupyter Notebook Terminal or Anaconda Prompt を開いて、interpretという名前の仮想環境を作成します。
# New Conda
conda create -n interpret Python=3.6
# Activate
conda activate interpret
- Microsoft Interpret ML をインストールします。
# Package Install
pip install interpret
- Jupyter Notebook をインストールし、カーネルを有効化します。
# Install Jupyer Notebook
conda install notebook ipykernel
# Jupyter Kernel Attach
python -m ipykernel install --user --name interpret --display-name interpret
# Jupyter が既に起動している or Notebook VM の場合は不要
# Start Jupyter Notebook
jupyter notebook