「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfrastructure.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。

-戻る
--[[DS:数学的基礎]]
---[[線形代数>DS:数学的基礎 - 線形代数]]
---[[微分・積分>DS:数学的基礎 - 微分・積分]]
---[[微分・偏微分>DS:数学的基礎 - 微分・偏微分]]
---確率・統計

--[[データサイエンス力]] > [[データ分析]]
---[[データ解析]]
---[[統計解析]]

*目次 [#zd382dbe]
#contents

*概要 [#k9e555cd]
不確実性を扱う学問(で)。

*集合 [#w97a6213]
-集合とはものの集まり
--「集合」の「要素」(「元」ともいう)同士は明確に区別できる。
--「集合」に「含まれる」or「含まれない」は明確に区別できる。
--確率・統計に登場する「事象」は「集合」として取り扱うことができる。

-数学的には
--S = {a, b, c, d, e, f, g}
--M = {c, d, g}
--M ⊂ S
--a ∈ S
--b ∈ S
--h ∉ S

**和集合と共通部分 [#jbe5c93f]

***和集合 [#k681db84]
-A ∪ B カップ
-A ∪ B = B ∪ A

***共通部分 [#v63760ef]
-A ∩ B キャップ
-A ∩ B = B ∩ A

**絶対補と相対補 [#qcfbc9f4]
補=~以外

***絶対補 [#h03195c8]
全体中のA以外:U ∖ A = Ā

***相対補 [#o4917b40]
AB中のA以外:B ∖ A

**例 [#f0f75c34]
-
 -------
 A ∪ B

-
 -------
 A ∩ B

-
 B ∖ A ∩ A ∖ B

-
 B ∖ A ∪ A ∖ B

*確率 [#h4189d92]
ある事象の起こり易さの度合い。

-頻度確率(客観確率)
--発生する頻度
---測定すれば必ず決まる。
---客観的に調べられる。

--例
---「10本のうち1本だけ当たりのクジを引いて当選する確率を調べたところ10%であった」という事実
---...

-ベイズ確率(主観確率)
--信念の度合い
---算出するのが難しい。
---全数調査が出来ないが条件を確認しながら確率を決める。

--例
---「あなたは40%の確率でインフレンザです」という診断
---...

以降は、頻度確率(客観確率)の定義について。~
(ベイズ確率(主観確率)については、[[コチラ>ベイズ統計#za029df0]])

**確率P(A) [#ie576c7a]

***ある事象Aの起こる確率P(A) [#r33e8ea6]
        n(A)     事象Aの起こる場合の数
 P(A) = --- = ----------------------------
        n(U)   起こり得る全ての場合の数

***ある事象Aの起こらない確率P(Ā) [#r33e8ea6]
 P(Ā) = 1 - P(A)

        n(A)   事象Aの起こらない場合の数     起こり得る全ての場合の数-事象Aの起こる場合の数
 P(Ā) = --- = ---------------------------- = -----------------------------------------------
        n(U)   起こり得る全ての場合の数                  起こり得る全ての場合の数

   n(U) - n(A)   n(U)   n(A)       n(A)
 = ----------- = ---- - ---- = 1 - ---- = 1 - P(A)
       n(U)      n(U)   n(U)       n(U)

**事象Aと事象Bの共通部分の確率P(A∩B) [#sf539a1d]
-P(A∩B) = P(B∩A)

-以下の区別が必要になる。
--[[条件付き確率>#s7b6e130]]
---P(A∩B) = P(A)P(B|A)
---P(B∩A) = P(B)P(A|B)
---P(A)P(B|A) = P(B)P(A|B)

--[[同時確率>#rf3abf38]]
---P(A∩B) = P(A)P(B)
---P(B∩A) = P(B)P(A)
---P(A)P(B) = P(B)P(A)

***条件付き確率P(A|B) [#s7b6e130]
-ある事象Bが与えられた下でAとなる確率
-例:自然言語では文脈で理解するので以下を区別し難い。
--◯:雨が降っている条件下で、交通事故に遭う確率
--☓:雨が降っていて、且つ、条件下で交通事故に遭う確率

          P(A∩B)  ┌ n(A∩B)   n(U) ┐  n(A∩B)
 P(A|B) = ------- =│ ------- * ---- │= -------
            P(B)   └  n(U)     n(B) ┘    n(B)

***独立な事象の同時確率P(A)P(B) [#rf3abf38]
-ある事象A、且つ、事象Bとなる確率
-例:自然言語では文脈で理解するので以下を区別し難い。
--☓:雨が降っている条件下で、交通事故に遭う確率
--◯:雨が降っていて、且つ、条件下で交通事故に遭う確率

 P(A∩B) = P(A)P(B|A) = P(A)P(B)

※ 積集合と言う言葉は別の意味に使用されるので使用しないが、同時確率の共通部分は積で計算可能。

***事象Aと事象Bの和集合の確率P(A∪B) [#deb23e92]
共通部分の確率P(A∩B)を使用して計算する。

 P(A∪B) = P(A) + P(B) - P(A∩B)

**数の数え方 [#wc90139c]

***場合の数 [#k74388fb]
ある数の要素を取り出して並べるときの数で、並べるのだから順番が違うものは違う場合として数える。

-繰り返しあり(重複順列)~
異なるnからr個選んで並べる場合の数
 n^r

-繰り返しなし~

--異なるnからn個選んで並べる場合の数(階乗)
 n! = n * (n-1) * (n-2) * ... * 1

--異なるnからr個選んで並べる場合の数(順列)
 nPr = n * (n-1) * (n-2) * ... * (n-r-1) = n!/(n-r)!

***組み合わせの数 [#dc0c1712]
ある数の要素を取り出した組合せの数で、組合せなので順番が違っても同じ場合として数える。

-異なるnからr個選ぶ場合の数(並べない
--nCr(選ぶ) * r!(並べる) = nPr(順列
--nCr = nPr / r!

-[[場合の数>#k74388fb]]で数えて、数え過ぎの部分を割るという考え方になる。

**...の起こる場合の数の制限 [#bb438e15]
-「同様に確からしい(同じように起こる可能性がある)」こと。

-同じように起こる可能性がある ≒ 生じる場合が等しい ≒ 同じ確率。

-確率の定義の中に確率が入るのでこの言い回し。

***「同様に確からしい」の例 [#n081ea4e]
「同様に確からしい(同じように起こる可能性がある)」=コインの表裏、サイコロ出目

-(通常の)サイコロの偶数の出る確率
--起こりうるすべての場合の数:六面体なので6
--偶数の出る場合の数:2, 4, 6なので3
--この確率は 3/6 = 1/2 になる。

-2を3に変更したサイコロの偶数の出る確率。
--起こりうるすべての場合の数:六面体なので6
--偶数の出る場合の数:2, 2, 4, 6なので4
--この確率は 4/6 = 2/3 になる~
(2は2回数えるので3/5ではない)。

***直感的ではない例 [#l95e55b7]
くじを順番に引いても、当たる確率は同じ。~
アタリ1枚、ハズレ4枚のケース。樹形図で計算すると...

-Aがアタリを引く確率は 1/5

-Bがアタリを引く確率は
--4/(5*4) = 1/5(ケースは4倍、アタリは4パターン
--Aハズレの確率 * Bアタリの確率 = 4/5 * 1/4 = 1/5

-Cがアタリを引く確率は
--4*3/(5*4*3) = 1/5(ケースは3倍、アタリは3パターン
--Aハズレの確率 * Bハズレの確率 * Cアタリの確率 = 4/5 * 3/4 * 1/3 = 1/5


*統計 [#u547d6f1]
-集団を数量的に理解する(四則演算ぐらいでできる。
-ココでは、ほぼ、[[代表値(統計量)>データ分析#j6ea2557]]について言及

**[[分布の中心>データ分析#xcffe56e]] [#k63a9fce]

***平均値 [#xbff4ad6]
平均は必ずしも普通を意味しない([[分布>#s9878207]]による)。

***中央値 [#yc718109]

***最頻値 [#of2a2521]

**[[分布のバラつき>データ分析#o1f7e894]] [#s9878207]

***[[分布>統計解析#g914fdcf]] [#gb284e1b]
色々な[[確率分布>統計解析#efae792f]]がある。

***[[分散>統計解析#m656dd23]] [#c60c77b0]
散らばり度ありの数値化

***[[標準偏差>統計解析#g9d1e77e]] [#oc3381ba]
分散の平方根

***[[偏差値>統計解析#w1e5109d]] [#m70cd00f]
標準偏差を平均≒50前後の値にしたもの。

**因果関係、相関関係、擬似相関 [#k67caee5]
***[[因果関係>統計解析#je5270cd]]と[[相関関係>統計解析#bad01586]] [#ea73b658]
***[[相関関係と擬似相関>統計解析#bad01586]] [#d1a87c52]

*参考 [#ddb76479]
-中学数学からはじめる確率統計 - YouTube~
https://www.youtube.com/watch?v=K2cJofUJVO8

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS