RPG脳で分かるクラスター分析!◆星1つ

今回のサマリー

はい、今回はクラスター分析をRPG脳で考えてみたいと思います。


16/08/15 山田メール((VRを選択)こ、この辺りか?)

RPG脳でクラスター分析

前回に引きつづき、ここに伝説の剣と鎖鎌と鉄の盾があったとします。

今回は、結果変数に強さ、[剣ダミー、鎖鎌ダミー、盾ダミー]という説明変数を攻撃力、守備力(強い、弱い)という質的変数に縮約する事にします。(あまり、うまい例えにはなりませんでしたが、笑)

複数の説明変数を、それより少ない質的変数に縮約する場合は、クラスター分析を使います。

それでは、ソースコードを見てみましょう。


重回帰データ <- read.table(file.choose(), header = TRUE)
# header = TRUE…データファイルの1行目が変数名を表す事を指定する。


k <- 2 # クラスター数


重回帰データクラスター分析 <- kmeans(重回帰データ, k)
重回帰データクラスター分析


画像で一言「(VRを選択)こ、この辺りか?」



忍者AdMax

続きを読む

RPG脳で分かる因子分析!◆星1つ

今回のサマリー

はい、今回は因子分析をRPG脳で考えてみたいと思います。


16/08/14 山田メール((女子ドッジボールを選択)きゃーどんだけ~)

RPG脳で因子分析

ここに伝説の剣と鎖鎌と鉄の盾があったとします。

統計的に考えると、結果変数に強さ、[剣ダミー、鎖鎌ダミー、盾ダミー]という説明変数を攻撃力、守備力という量的変数に縮約するような感じです。

そんなものを持って町を歩いている人がいたら少し心配になりますが、複数の説明変数を、それより少ない量的変数に縮約する場合は、因子分析を使います。

それでは、ソースコードを見てみましょう。


重回帰データ <- read.table(file.choose(), header = TRUE)
# header = TRUE…データファイルの1行目が変数名を表す事を指定する。


相関行列 <- cor(重回帰データ)
相関行列


重回帰データ因子分析 <- factanal(重回帰データ, factors = 2)
# factors = 2…因子数を2にする。
重回帰データ因子分析


共通性 <- 1 - 重回帰データ因子分析$uniquenesses
共通性


画像で一言「(女子ドッジボールを選択)きゃーどんだけ~」



忍者AdMax

続きを読む

ジャック君は結婚できるかロジスティック回帰!◆星1つ

今回のサマリー

はい、やっていて笑ってしまいましたが、身長2m、体重200kgのジャック・ハンマー君は結婚できるか、人工データをロジスティック回帰で検証したいと思います。


16/08/13 山田メール(テニスでいいのかな?(ニヤリ)俺は卓球で行くぜ)

ロジスティック回帰

結果変数が二値(1か0)の場合は、ロジスティック回帰を使います。

はい、まずはソースコードからです。


y <- c(rep(c(0, 1), 10))
身長 <- runif(n = 20, min = 120, max = 200)
体重 <- runif(n = 20, min = 50, max = 150)
# 乱数で作っている時点でおかしいんですが、笑


y
身長
体重


res <- glm(y ~ 身長 + 体重, family = binomial(link = "logit")) # ロジスティック回帰
summary(res)


仮に、身長が高いほど、体重が軽いほど結婚しやすいとして、身長2m、体重50kgで独身のデータができたら、微妙な空気になりますよね。笑


画像で一言「テニスでいいのかな?(ニヤリ)俺は卓球で行くぜ」



忍者AdMax

続きを読む

ダミー変数を使う!◆星1つ

今回のサマリー

今回は、ダミー変数について話をしたいと思います。


16/08/11 山田メール(最強の兜もらったー)

ダミー変数を使う

重回帰分析で、説明変数が質的変数の場合は、ダミー変数を使います。

ダミー変数とは、例えば、ポイントサイト紹介者をタイプA(論理型)、タイプB(中間型)、タイプC(記憶型)に分けるとしたら、タイプAダミー(タイプAなら1、それ以外なら0)といったように、1か0かで表したものです。

分類が3つ、ある場合は、2つ(分類-1)用意します。

タイプA、タイプB、タイプCとあったら、タイプAとタイプBだけ用意して、両方0ならタイプCになります。


画像で一言「最強の兜もらったー」



忍者AdMax

続きを読む

検定の多重性について!◆星1つ

今回のサマリー

今回は、検定の多重性について話をしたいと思います。


16/08/10 山田メール(この辺りに魔王いないでしょー)

検定の多重性

第1種の誤りとは、実際には差がないのに差があると判断してしまう事です。

検定を繰りかえすと、この第1種の誤りを犯す確率が大きくなってしまいます。

例えば、p値5%で2回のt検定では、1度目の検定で、第1種の誤りを犯さなかった95%の95%が第1種の誤りを犯さない確率になるので、検定を繰りかえす度に第1種の誤りを犯す確率が大きくなっていく事になります。

まだ仮説を用意していないので分からないんですが、ボンフェローニ補正なども必要になると思います。


画像で一言「この辺りに魔王いないでしょー」



忍者AdMax

続きを読む