Tabla de Contenidos
科学であれ工学であれ、さまざまな種類の計算を実行する場合、さまざまな表にまとめられた実験データに頼ることは非常に一般的です。これらのデータは通常、相互に依存していることがわかっているが、数学的な依存関係がわからない 2 つの変数に関連しています。必要なデータがすべてテーブルにある場合、これは問題になりませんが、これはめったに起こりません。テーブルにない変数の値に対して、変数の 1 つの値が必要になることはよくあります。
これが発生すると、実験データまたは集計データを多項式数学関数に適合させることができます。これを使用して、関心のある変数の未知の値を概算できます。このプロセスには、内挿または外挿が含まれる場合があります。
これら 2 つのプロセスは密接に関連しており、同じ基本的なチューニング手順に基づいていますが、同じではありません。次に、独立変数の特定の値に対する従属変数の値を推定するこれら 2 つの方法の主な違いについて説明します。
補間定義
内挿とは、推定したいポイントの上下にある一連のデータまたは離散ポイントの知識から、独立変数の特定の値に対する従属変数の値を推定するプロセスです。つまり、2 つの既知の点の間にある点を推定するプロセスです。次のグラフは、青い点で表される一連のデータを示し、赤い点は X 1と X 2の点の間の補間を表します。
補間という言葉は、2 つのラテン語の接頭語であるinter- の結合に由来します。これは、間または間隔を置いてという意味です。 -polireは、押したり推進したりすることを意味します。それらの間にあるポイントに。
外挿定義
外挿は、推定されるポイントよりもすべて大きいか、またはすべて小さい一連のポイントまたはデータから、独立変数の値に対する従属変数の値を推定するプロセスとして理解できます。
つまり、すべての既知のポイントまたはデータより上または下にあるポイントの値を推定するプロセスです。次の図は、すべての既知のデータを超えるポイントにデータを外挿する例を示しています。
語源の観点からは、extrapolate は同じラテン語の語根–polire を持ちますが、今回だけラテン語の接頭辞extra-が前に付いており、これは out of を意味します。したがって、この用語は、すべての既知のデータよりも大きいか小さいかのいずれかの理由で、元のデータ セットの範囲外にあるポイントの推定値を指します。
内挿と外挿の不確かさの違い
内挿と外挿を比較すると、探しているデータの実際の値から大きく逸脱する結果が生じるリスクに関して、重要な違いがあることがわかります。補間の場合、連続する 2 つの点の間で実行されるため、補間する値がこれらの 2 つの点の間のどこかにあるというある程度の確実性を得ることができます。つまり、未知の関数の値が次のポイントに到達する前に急上昇または急降下しないという保証があります。これは、次のポイントがどこにあるかを知っているためです。
代わりに、外挿を行うとき、データの動作を前方または後方に投影しています。前方 (またはその場合はさらに後方) の参照ポイントがないため、データがどのように動作するかを知る方法がありません。 . 本当に変数です。いずれかの方向に突然発砲するなど、以前と同じ動作を続ける可能性があります。このため、外挿は内挿よりも不確実性が高くなります。
それらは通常、異なる多項式関数に適合します
外挿および内挿プロセスは、2 つ以上の既知のポイントを数学関数に調整することに基づいており、他の未知のポイントでの関数の値を予測することができます。内挿と外挿のどちらの場合でも、推定に最も一般的に使用される関数は線形関数 (y = mx +b) です。この関数は、推定したい未知の値が既知のポイントにかなり近い場合の内挿と外挿の両方に適していますが、極値から外挿する場合はそうではなくなりました。
実際、データ全体の挙動が著しく直線的でない場合、どちらかの極端から離れるにつれて、外挿は真の値から非常に急速にずれてしまう可能性があります。これが、外挿が通常より注意を払い、内挿に使用されるものよりも複雑または高次の外挿関数を使用する必要がある理由です。
後者の場合、既知のデータまたはポイントが離れすぎていないと仮定すると、ほとんどの場合、線形補間で十分です。
見積もりに必要なデータ項目の数が異なる場合があります
内挿と外挿のもう 1 つの重要な違いは、推定を実行するために必要なデータ項目の数です。補間では、ほとんどの場合、求める点の値は最も近い 2 つの点を結ぶ直線上にあると想定されます。この場合、補間を実行するには、これらの 2 つの点が分かれば十分です。言い換えると、推定されたポイントはほとんど常に 2 つの既知のポイントの間にあるため、補間に対する勾配推定のエラーの影響が深刻になることはめったにありません。
一方、外挿の場合、最高点 (または最低点) から遠ざかるにつれて、直線の傾きの違いが y の値に及ぼす影響が大きくなるため、2 つだけを取るのは非常に危険です。勾配を計算するポイント。これらの場合、通常行われることは、最小二乗法によっていくつかの点を最良の線または高次の別の多項式関数に適合させることです。これにより、前方 (または後方) に外挿する線が、いくつかのデータだけでなく、全体としてのデータ。
線形内挿および外挿
線形補間と線形補外の場合、本質的に同じ数式が使用されます。どちらの場合も、補間関数の形式は y = mx + b です。ここで、y は指定された x の値に対して求める値、m はデータを当てはめる直線の傾き、b は補間関数のy軸でカットしたものです。
線形関数の勾配は、次の式を使用して任意の 2 点から計算できます。
この式を 2 回適用できます。1 回目は一連の既知のデータの任意の 2 点間で、もう 1 回は既知の点と見つけたい点の間に適用できます。どちらの場合も傾きは同じなので、両方の式を一致させて、探している y の値を特定の x の値に関連付ける式を得ることができます。
例
2 つの連続する点 p k-1 =(x k-1 ; y k-1 ) および p k =(x k ; y k )を使用して、任意の点 (x ; y) を内挿または外挿するとします。次に、勾配を 2 回書き、次の式を得ることができます。
この方程式を整理すると、次のようになります。
この場合、推定に使用される 2 つのデータに関連する点 (x ; y) の位置については何も仮定されないため、内挿と外挿の両方に同じ式が使用されることに注意してください。
x k-1 < x < x k、つまり x が x k-1と x kの間にあることが確認された場合、それは補間です。一方、x>x maxまたは x<x minの場合、つまり x がデータ系列の最大値より大きいか最小値より小さい場合は外挿です。
補間例
ベネズエラのメリダ市でのピザの需要は、1 枚あたりの平均価格が 20 ドルの場合、年間 500,000 ユニットであり、平均価格が 15 ドルの場合、需要は 750,000 ユニットに増加することがわかっているとします。価格を 16.5 ドルに設定した場合の需要を見積もることに関心があります。
解決
これは補間の例であることに注意してください。これは、16.5 ドルの価格に対応する推定したいポイントが 2 つの既知のポイントの間にあるためです (つまり、15 ドルと 20 ドルの間)。この例では、次のようになります。
ここで、線形補間式を適用します。
したがって、ピザの平均価格が 1 ユニットあたり 16.5 ドルに設定されている場合、年間需要は年間 675,000 ピザになります。
外挿の例
上記の同じ例で、価格が 1 単位あたり 25 ドルに上昇した場合の需要を判断したいとします。この場合、x = 25 ドル > 20 ドルであることが検証されているので、これは外挿です。繰り返しますが、データは次のとおりです。
代用:
したがって、外挿では、価格が 25 ドルに上昇すると、需要は 20 ドルのときの半分に減少すると予測されます。
参考文献
アロンソ。(2006 年 2 月 13 日)。3 ポイントからの補間方法。マドリッド大学。https://www.um.es/geograf/sigmur/temariohtml/node43_mn.html
ゴンザ D. (2016 年 9 月)。単位: データの内挿と外挿。doloresgonza.files. https://doloresgonza.files.wordpress.com/2016/09/interpolacion-1.pdf
レスカナリス。(nd)。外挿と内挿の違い – 興味深い – 2022 . https://us.leskanaris.com/3668-the-difference-between-extrapolation-and-interpolation.html
Pinzón, J. (2013 年 10 月 9 日)。補間と補外。ジュリアナピンゾン。https://julianapizon.wordpress.com/interpolacion-y-extrapolacion/
ユニガル。(2021 年 9 月 14 日)。線形補間の式、定義、例など. https://unigal.mx/formula-de-interpolacion-lineal-definicion-ejemplos-y-mas/