3-4

・平均値は真実を捉える理由 因果関係の洞察という観点で平均値の方が中央値より関心のあることに 対する直接的な答えとなっていることが多い。 多くの場合何らかの結果を示す結果を示す値の総量を最大化したい ということに向けられるが それに対して中央値…

3-4

・平均値は真実を捉える理由 因果関係の洞察という観点で平均値の方が中央値より関心のあることに 対する直接的な答えとなっていることが多い。 多くの場合何らかの結果を示す結果を示す値の総量を最大化したい ということに向けられるが それに対して中央値…

3-3

■洞察には中央値よりも平均値を 現状把握のための統計学では、平均値だけで物事を判断してはいけない ということがよく言われる。 データの中心を判断数ための代表値として平均値を使うことは ミスリーディングだとされる。 会社の平均年収が500万円の場…

3-2

■洞察の統計学に必要な3つの知識 現状把握のための単純集計にしか統計学を使ってこなかった人が、 分析による因果関係の洞察に踏み出すにあたり、身に付けるべき知識が 3つある。 ・平均値や割合などの統計指標の本質的な意味の理解 ・「データを点ではな…

三冊目

序章 ■ビジネスに必要なのは、人間を洞察するための統計学 一人ひとりが多様で、意思決定のメカニズムが複雑で、 こちらからの働きかけで何かを変化させることが難しいのが人間。 この本で説明する統計学は全て人間を洞察し、その行動や あり方を少しだけ改…

機械学習

いよいよ、二冊目も最終章です。 ■問題 仲間とみんなで協力して強いボスを倒すイベントを作りたい 重要なのはチーム編成をどうするか よりチーム戦の楽しさを引き出すようなチーム編成がないか ■チーム戦の楽しさの定義 仲間とリアルタイムで一緒に戦ってい…

決定木分析

■テーマ どんな行動をしたユーザが継続するか ゲーム自体に特に問題はない状態ではあるが 新規ユーザの離脱が多いということでより 離脱を少なくするためにどうすればいいかを考えていく。 ■離脱する理由よりも、継続する理由を考える ライトユーザはコアユ…

クラスタリング分析

この章は、いきなり主成分分析などの知らない分析が出てきて 話が飛躍しすぎている。初見でわかる人いないと思う。 ゲームをプレイしている人たちはどんな人たちかを理解する 方法として、20代男性が多いなどと分けることがありますが ゲームをプレイしてい…

ロジスティック回帰

この章は理解がなかなか難しかった。 問題としては、ガラケーからスマホへの移り変わりが 激しい時の話でDAUが携帯電話ユーザの減少に対して スマホユーザの上昇が少ない。 つまりトータルでDAUが減少しているということ。 ガラケーユーザ減少の原因の仮説は…

重回帰分析

今までの分析手法は、関係性を明確化していた。 例えば、値引き額と販売量は関係があるといったぐあい。 この分析手法では、実際にどれだけ値引きをするとどれだけ販売量の 増加を見込めるのかというのはわからない。 こんなときに、役立つのが回帰分析(重…

A/Bテスト

複数の選択肢のうち、どちらがよりより結果をもたらすかを 見極めるための検証方法の一つ 例えば、あるアプリ内で、ゲームのアイテムのセールを行なっているとして その販売ページへの誘引をするためにバナーが作られる。 ユーザはこのバナーを見て、興味を…

クロス集計

今日は第4章を読みました。 先週と違い、土日の2日に分けて書けました。 これが平日にできるようになるとより優秀なんですが。 ■クロス集計 4章はクロス集計の話で、その使い方を実例をもとに示していました。 クロス集計は手段の一つで先日書いたフレームワ…

2冊目

今日からは あたらしい本を読んでいきます。 前回よりはビジネスよりでより実践的な話が学べると いいなと思います。 全10章で今日は、3章まで読みました。 1,2章が全体のざっくりした話で 3−6章は、データ分析に関心がある人向けで 7−10章はデー…

相関

1週間に2回ぐらいやらないと、進みが良くないので 2回やることにしましたが 1日に2回書いてどうすんねんというところではあります。 ■相関図 あるいは散布図と呼ばれる。 例えば、学生が4人いてそれぞれの科目のテストの点数を表すとき 科目Aの点数を…

検定

■仮説 コインを5回投げて5回連続表が出たときに、そのコインは本当に2分の1の 確率で表裏が決定するのか。 このときに、かたよっていないという仮説を立てて考える。 この場合かたよっていない確率は3%になります。 この確率をもっと少なくするため(…

推定2

今までの投稿を見直すと何書いてあるかわからないところが ちょくちょくあるので、まだ理解度は低いんだろうなぁという 印象。実際に手を動かしてやってみないと理解は低いかも。 目標は週一以上で投稿することだが、理解をすすめるという意味では 実際にや…

推定

一部分から全体を推定する話 ■部分から全体を推測する方法 例えば、成人男性の平均身長を求めるときに 全員を調査するのは時間がかかる。 時間がかかると調査したデータの価値もどんどん なくなっていく。 なので、一部の人を選び出し全体を推測することが …

分布

そろそろ、数式とかグラフが重要になってきて 文字だけで書くのが辛くなってきた。 ■場合の数 答えが〜通りになるやつ 5人の中から順序を考えないで、3人を選ぶときに何通りあるか という問題。 順序を考える場合と、考えない場合の違いを理解することが重要…

確率の用語編

今日は確率の第三章 確率の基礎です。 ■標本点 コインを投げたとき結果は表か裏かしかない。 このときの起こりうる個々の結果を標本点という。 ■標本空間 標本点の全体の集合、標本空間はΩで表される。 今回の例だと Ω={表、裏}になる。 よくわからない。…

統計学の用語

今週も先週と同様に用語を書いていきます。 最低週一でやっていますが、もっと頻度高めたいですね。。。 ■レンジ あるデータの最大値から最小値を引いた値。 データのばらつき具合を表すのに使える ただ1つの異常な値のデータで大きく変わってしまうので 使…

統計学の用語編

人のために書くというよりは、自分の理解のためなので わかりにくいかもしれないけど、箇条書きとかメモっぽい書き方で 一度書いてみます。いろいろ試します。。 ■階級 使ってはいるが、こういう言葉だったのかという感じ ある数値ごとに区切るときの値。 例…

マンガでわかる統計入門 中学数学だけで理解できる!

僕はkindle paper whiteを今後の勉強のためにと年末に購入しまして 今、kindle unlimitedに加入して面白そうな本を読もうとしています 僕はおそらく本を読むのが得意ではないのでよくマンガに逃げています 統計学を学びたいけど文章だけだとどうせ読まなくな…

はじめてのブログ

はじめまして。 今日から統計というか数値を扱うことについて学んでいきたいと思います。 そうは言っても今までやるやる詐欺でやれてこなかったので 外部に公開する形で始めてみました。 週に1回以上更新することを目標とすることで ちょっとはやる気出すん…