読者です 読者をやめる 読者になる 読者になる

クラスタリング分析

この章は、いきなり主成分分析などの知らない分析が出てきて

話が飛躍しすぎている。初見でわかる人いないと思う。

 

ゲームをプレイしている人たちはどんな人たちかを理解する

方法として、20代男性が多いなどと分けることがありますが

ゲームをプレイしているユーザを理解するには不十分。

 

次の施策に繋げやすい、ゲームの内容にそった分類をしたい。

ゲーム上の行動パターンでセグメント分けできるとわかりやすい。

 

行動データを用いて似ているユーザをグルーピングする方法として

クラスタリングと呼ばれる手法が適切。

クラスタリングの1つであるk-means法を使う。

グルーピングの手順は以下の通り。

 

1. k個のクラスタの中心の初期値を決める

2. 各データと1.でのk個のクラスタ中心との距離を求め、もっとも近いクラスタに分類

3. 形成されたクラスタの中心を求める

4. クラスタの中心が変化しない時点までステップ2. 3. を繰り返す

 

行動ログは様々な行動について、記録されているため

ほとんどが0のログだったり強い相関をもつログがあります。

例えば、バトル回数が多いほどボス討伐回数が多いなどです。

このようなデータがある場合、k-means法がうまく動かない可能性が

ある。なので、これらをデータから排除します。

(読んでる限りこれはよしなにやるらしい

 

弱い相関を持った、データはまだいくつか残っている場合がある。

このままでも動くが、説明変数は直交であることが望ましい。

(ちょっと、何言ってるかわからない

 

これを解決するために、主成分分析を行う。

主成分分析は、相関のない主成分と呼ばれる値に変換すること。

 

ここまでで、データが準備できたのでクラスタリングを実行

したいところだか、クラスタの数をどうするかという問題がある。

クラスタの数は分析者に委ねられている。

どんなユーザがいるのかを知るのが目的なので、

あまり多すぎると理解しにくい。今回だと5個ぐらいが良さそう。

 

クラスタリングした結果をRを使えばレーダーチャートで表示できるらしい。

今回だと、協力したい(友達の応援などをよく行なっている)ユーザが

ARPU, ログイン日数が他クラスタより高く、協力を促す施策を行うことに

なりましたとさ。

 

■まとめ

今回の前提はゲームのユーザが頭打ちになっていて、

既存ユーザを大事にしていきたいというところから

どういうユーザがいるのだろうという話に繋がっていきます。

今まで、色々な分析手法がありましたがそれぞれに使うべき

場所があり課題から手法を決定することが大事であると感じました。

 

また、今回は実際に施策をしたときに振り返りができるように

この分析を自動化し、レポートできるようにしています。

こういうことも考えられるようにならないとなぁと思いました。