目的
この記事では、応用情報技術者試験の出題分野である応用数学に関する覚書きを列挙する。
統計分析
-
正規分布
最も一般的な確率分布で身長、座高など身近な分布に多く見られる。
その分布表現は、以下の確率密度関数として定義される。平均値:\(μ\) 、標準偏差:\(σ\) と置くと
\[ f(x) = \displaystyle \frac{1}{\sqrt{2\pi \sigma^2}} \exp \left(-\frac{(x - \mu)^2} {2\sigma^2} \right) \]この標準偏差 \(σ\) の分布比率は以下の通り。
- \(\pm 1σ\) で \(68%\)
- \(\pm 2σ\) で \(95%\)
- \(\pm 3σ\) で \(99.7%\)
以下、統計分析の種類。
-
回帰分析
関数モデルを使用した分析で変数が \(1\) つなら単位回帰分析、複数なら重位回帰分析という。 -
主成分分析
変数が多い場合、より少ない指標や合成変数に要約する分析手法。 -
因子分析
観測結果に影響する潜在要因(因子)を分析する手法。 -
相関分析
二つの変数(データ分布)がどの程度直線的(比例関係)にあるかを数値化して分析する手法。この数値を相関係数という。
→ データ分布が右上がりの直線に近い程 \(1\) に近づく。
→ データ分布が右下がりの直線に近い程 \(-1\) に近づく。
→ データ分布が無相関である程 \(0\) に近づく。
相関関係と因果関係
-
相関関係
二つの事象が互いに関連している関係のこと。 -
因果関係
二つの事象の一方が原因となって別の事象が発生していること。
→ 相関関係にあるほど相関係数 \(=1\) となる。
そして、二つの事象のどちらに原因があり、どちらが結果であるか因果関係を求めるためには、ランダム化比較試験等の別途検証が必要。 -
疑似相関
一見相関関係または、因果関係が認められる事象でも、直接的な関連性がなく結果のみ相関していること。例 : 子供の体重が重い程、算数ができるという相関関係の場合
→ 体重が重くなった原因に「年齢が上がる = 学年が上がる」という相関関係が隠れているため、体重と算数の出来に直接的な関連はなくこの場合、疑似相関となる。
数値計算
-
スカラ
\(0\) 次元で表現できるデータ。
→ 決まった数値を表し、固定の数値データのこと。 -
ベクトル
\(1\) 次元で表現できるデータ。
→ \(1\) 次元配列等の一列で表現できるデータのこと。 -
行列
\(2\) 次元で表現できるデータ。
→ \(2\) 次元配列等の縦、横など二種類の軸(行列)があるデータのこと。 -
テンソル
\(3\) 次元で表現できるデータ。
→ \(3\) 次元配列の縦、横、高さなど三種類の軸があるデータのこと。
グラフ理論
-
グラフ理論
ノード(接点、頂点)とエッジ(枝、辺)の集合から構成されるデータ構造についての理論。 -
グラフの方向性
有向グラフは、ノード \(A\) → ノード \(B\) のように一方のみに方向性を持つ。
無向グラフは、ノード \(A\) ↔ ノード \(B\) のように双方向に方向性を持つ。 -
木構造
木構造(単に木とも呼ばれる)は、閉路(閉じたノード)を持たないグラフ構造でルート(根)、ノード(枝)、リーフ(葉)から構成される。
待ち行列理論
-
待ち行列理論
列に並ぶ平均時間を統計学的な計算で求めるための理論。
→ 以下、\(3\) 要素が列に並ぶ時の待ち時間に影響を与え、待ち行列のモデルとなる。- 到着率:来客頻度。
- サービス時間:対応時間。
- 窓口数:\(1\) 列あたりの窓口数。
- 到着率:来客頻度。
-
\(M/M/1\) モデル
以下、\(3\) つの変動を取るときの待ち行列モデルのこと。- 到着率:来客頻度が一定(\(D\))ではなくランダム(\(M\))。(ポアソン分布)
- サービス時間:対応時間が一定(\(D\))ではなくランダム(\(M\))。(指数分布)
- 窓口数:窓口数が \(1\) つ。(一定(\(D\)))
- 到着率:来客頻度が一定(\(D\))ではなくランダム(\(M\))。(ポアソン分布)
待ち時間の計算
-
\(M/M/1\) モデルの平均待ち時間
\(M/M/1\) モデルの場合に限定すると、平均待ち時間は、次の式で表現できる。平均待ち時間:\(s1\)
平均サービス時間:\(s2\)
利用率:\(ρ\) と置くと\[ s1 = \frac{ρ}{1 - ρ} \times s2\hspace{5mm}・・・(*) \]※ 利用率\(ρ\)は、平均サービス時間/平均到着間隔で表現できる。
また、平均応答時間は、平均待ち時間(\(s1\) モデル)と平均サービス時間(\(s2\) モデル)を合わせた時間となり、上記(*4)より、次の式で表現できる。
→ 平均応答時間 \(= s1+ s2\)
\(\displaystyle = \frac{ρ}{1 - ρ} \times s2 + s2\)
\(\displaystyle = ( \frac{ρ}{1 - ρ} + 1 ) s2\)
\(\displaystyle = \frac{1}{1 - ρ} \times s2\)
参考文献
- 瀬戸 美月 (2020) 『徹底攻略 応用情報技術者教科書』株式会社インプレス