Skip to content
This repository has been archived by the owner on Oct 10, 2020. It is now read-only.

Commit

Permalink
pbi step
Browse files Browse the repository at this point in the history
  • Loading branch information
konabuta committed Sep 23, 2019
1 parent 6917724 commit 5f75db1
Showing 1 changed file with 48 additions and 10 deletions.
58 changes: 48 additions & 10 deletions Handson/Key-Influencers-titanic-survived.md
Original file line number Diff line number Diff line change
Expand Up @@ -5,40 +5,78 @@
## 1. データのダウンロード
[Kaggle : Titanic Machine Learning from Disaster](https://www.kaggle.com/c/titanic/data) からタイタニック号の乗船顧客データをPCにダウンロードします。

<img src="../docs/images/kaggle-titanic.png" width = 500><br/><br/>
<img src="../docs/images/kaggle-titanic.png"><br/><br/>


train.csv をダウンロードします。

<img src="../docs/images/kaggle-data-download.png" width = 500><br/><br/>
<img src="../docs/images/kaggle-data-download.png"><br/><br/>


## 2. データのアップロード
Power BI Desktop を開いて、CSV データをインポートします。
Power BI Desktop を開いて、CSV データをインポートします。対象のファイルを選択します。

<!-- <img src=""> -->

無事インポートされていることを確認してください。

<!-- <img src=""> -->
<img src="../docs/images/pbi-import-csv.png"><br/><br/>

"読み込み" をクリックして、インポートします。
<img src="../docs/images/pbi-import-preview.png"><br/><br/>

<br/><br/>

## 2. データの変換
Key Influencers が利用できるように、"Surviced" 列のデータ形式を **_バイナリ_** に変更します。
Key Influencers が利用できるように、"Surviced" 列のデータ形式を修正します。

左のデータタブにアクセスし、**クエリを編集** を選択します。
<img src="../docs/images/pbi-query-edit.png"><br/><br/>

Survived 列のデータ形式を **テキスト** に編集します。
<img src="../docs/images/pbi-query-edit.png"><br/><br/>

**新規手順の追加** を選択します。

<img src="../docs/images/pbi-change-coltype.png" width = 300><br/><br/>

Survived 列のデータ形式がテキストに変更されて、**適用したステップ** にて "変更された型1" が追加されていることを確認します。

<img src="../docs/images/pbi-query-done.png"><br/><br/>

**閉じて適用** をクリックして、データに適用させます。

<img src="../docs/images/pbi-query-apply.png" width = 250><br/><br/>


<br/><br/>

## 3. Key Influecers
レポート作成画面に移動し、右上の視覚化から **主要なインフルエンサ** ( = Key Influencers) を選択します。変数データを下記のようにドラッグ & ドロップで移動します。

<img src="../docs/images/pbi-ki-visual-add.png"><br/><br/>

データをフィールドからドラッグ&ドラップで移動します。**分析** にところには、Survivced 列を持ってきます。説明の所には任意のもので構いません。

<img src="../docs/images/pbi-ki-data.png" width=250><br/><br/>

<br/><br/>

## 4. 結果の確認
**主要なインフルエンサ** の結果を確認します。下記のように生存有無に大きく影響する単一の変数とその値の範囲が導出されます。ここでは回帰の手法が用いられています。

<img src="../docs/images/pbi-ki-left.png"><br/><br/>

**上位セグメンント** の結果を確認します。特徴的なセグメントが表示されます。一番生存確率が低いセグメントをクリックします。

<img src="../docs/images/pbi-ki-right.png"><br/><br/>

下記のように生存有無に大きく影響する複数変数の組み合わせが導出されます。ここでは決定木の手法が用いられています。

<img src="../docs/images/pbi-ki-top-segment.png"><br/><br/>


<br/><br/>

## (Option) 5. ダッシュボードの作成
出来上がった画面にフィルターを追加し、性別毎の特徴など、様々な観点で分析してみます。
出来上がった画面にフィルターを追加し、性別毎の特徴など、様々な観点で分析してみます。

例えば性別のフィルターを追加すると、下記のようなダッシュボードが完成します。

<img src="../docs/images/pbi-ki-dashboard.png"><br/><br/>

0 comments on commit 5f75db1

Please sign in to comment.