日期:2024-11-13 15:22
的貢獻。雖然因變量與自變量之間的相關性是我們所期望的,但自變量之間的相關性卻是我們需要避免的。例如,我們不希望出現以下情況:
X? = ? + ?X?
這就是多重共線性的表現 自變量之間表現出類似因變量的線性關系,給模型的訓練和推斷帶來了混淆和不確定性。
為何需要處理多重共線性?
讓我們通過一個簡單的例子來理解多重共線性的影響。考慮以下用于預測目標變量?的方程:
? = 10 + 2X? + 5X?
假設X?和X?之間存在強相關性,我們可以將它們的關系表示為:
X? = X? + 1
那么,原始方程可以轉化為以下兩種形式:
? = 12 + 0X