Tabla de Contenidos
指数分布は、ガンマ分布の特殊なケースです。これは、ポアソン過程でイベント間に経過した時間の確率分布を記述するために使用される連続分布です。これは、イベントが継続的かつ互いに独立して発生するプロセスを指しますが、一定の平均頻度で発生します。
指数分布は、次の確率関数に従います。
ここで、Xは連続確率変数で、ラムダ ( λ ) は特定の各分布の特性パラメーターです。次の図は、さまざまな値の λ に対するこの分布関数のグラフを示しています。
ご覧のとおり、この関数は λ に等しい初期値から指数関数的に減衰し、x が増加するにつれて漸近的にゼロに近づきます。
この分布関数の平均は μ = 1/ λ で与えられ、その分散は σ 2 = (1/ λ) 2です。次のセクションでは、中央値の計算方法を示します。
指数分布の重要性
冒頭で述べたように、指数分布は、ポアソン過程に従う任意のシステムに適用できます。これは、顧客がサービス施設に到着するなどのイベント間の時間、電子システムまたはコンポーネントの故障間の時間、および生物の生存を説明するのに役立つことを意味します。
中央値とは何ですか?
中央値の計算に進む前に、それが何であるかを理解する必要があります。確率分布の中央値は、分布を半分に分割する確率変数の値に対応します。離散変数の場合、これは中央値の両側に同じ数の値を残すことを意味します。指数関数およびその他の連続分布関数の場合、中央値は両側の確率密度曲線の下に同じ領域を残すポイントです。
中央値を見るもう 1 つのより実用的な方法 (この記事で使用する方法) は、分布関数の値が 0.5 になるポイントに対応することです。つまり、次の方程式の解に対応します。
指数分布の中央値の計算
指数分布の中央値を見つけるには、前のセクションで説明したように、分布関数を使用して、分布関数の値が 0.5 になる確率変数の値を見つけます。言い換えれば、中央値 (Me) は確率変数 x の値であり、次のことが検証されると言えます。
あとは、指数分布に対応するpdf ( f(x) ) をプラグインして統合するだけです。
確率分布関数の区分的定義を利用した場合、ゼロ以下の確率変数のすべての値に対してゼロの値を持ちます。これは単純な積分です:
ここで、1/2 に等しく設定し、方程式を解いて中央値 Me を見つけます。
最後に、再配置され、両方のメンバーで自然対数が取られ、Me がクリアされます。
したがって、指数分布の中央値は ln2/λ で与えられます。
指数分布の偏り
先ほど取得した中央値の値 ln2/λ を、冒頭で述べたこの分布の中央値の値 1/λ と比較すると、中央値が平均よりも小さいことがすぐにわかります。 ln2 は 1 未満の数値です。
平均が中央値と一致しない場合は常に、分布が歪んでいると言われます。この場合、平均は中央値よりも大きいため、指数関数は右に歪んでいると言われます。
中央値は、平均値よりも極端な値の影響を受けにくい中心傾向の尺度であるため、このようにバイアスが存在すると判断される場合は、中央値を使用してその中心傾向を表すことをお勧めします。
参考文献
レスカナリス。(nd)。指数分布の中央値の計算方法 – 興味深い – 2021. https://us.leskanaris.com/2916-exponential-distribution-medians.htmlから取得
ライフハック。(2018)。指数分布の中央値を計算する方法 – 2021. https://esp.lifehackk.com/14-calculate-the-median-of-exponential-distribution-3126442-7366から取得
簡単な数学。(2021 年 9 月 6 日)。中央値 – 指数分布[ビデオ ファイル]。https://www.youtube.com/watch?v=0s3h1Tfysogから復元
Mtz De Lejarza E., J., & Mtz De Lejarza E., I. (1999). 指数分布。https://www.uv.es/ceaces/base/modelos%20de%20probabilidad/exponencial.htmから取得