선형대수 정리 - 고유값, 고유 벡터, 고유값 분해

» math

1. 고유값과 고유 벡터

  • $y = Ax$의 식에서 $n \times n $​​​ 정방행렬 $A$​​​를 선형변환으로 봤을 때, 행렬 $A$​​​를 고유 벡터(eigen vector) $v$​​​와 고유값(eigen value) $\lambda$​​​으로 표현되어집니다.

  • $Av = \lambda v$​

    $\begin{bmatrix}a_{11} & \cdots & a_{1n} \\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn} \end{bmatrix} \begin{bmatrix} v_1 \\ \vdots \\ v_n \end{bmatrix} = \lambda \begin{bmatrix} v_1 \\ \vdots \\ v_n \end{bmatrix}$​​

    열벡터 $v$​에 선형변환 행렬 $A$​를 곱하였을 때, 위 식을 만족하는 상수 $\lambda $​를 고유값, 0이 아닌 열벡터 $v$​를 고유 벡터라고 부릅니다.

  • 고유 벡터(eigen vector)

    • 선형변환을 거쳐서 나온 벡터가 크기는 변하더라도 방향은 바뀌지 않는 벡터를 고유 벡터라고 부릅니다.
    • 고유 벡터는 선형변환이 되어진 공간에서 방향이 바뀌지 않는 중심축의 역할을 하기에 해당 공간을 가장 잘 나타내는 벡터라고 할 수 있습니다.
    • 만약 행렬 $r(A) = n$​​​ 인 비특이행렬(정칙행렬)이고, $n$​개의 선형독립인 경우 고유 벡터들은 $n$​​ 차원 공간을 생성(span)하는 기저 벡터의 역할을 수행하며 고유값 분해가 가능해집니다.
  • 고유값(eigen value)

    • 고유값은 고유 벡터가 변화되는 정도를 의미하며 스칼라입니다.
    • 고유 벡터의 크기에 해당합니다.

1.1 특성다항식(characteristic polynomial)

  • $Av = \lambda v $​

    $Av-\lambda v = 0 $​, $0$은 영벡터

    $ \ (A-\lambda I)v = 0 $, $I$​는 단위 행렬

    $\ det(A-\lambda I)v = 0$​

  • $\ det(A-\lambda I) = 0$​​​​ 은 특성다항식으로 고유치를 구하기 위해서 사용되어지며 특성다항식의 실근은 가우스-조르단 소거법을 통하여 고유값을 계산합니다.

  • 계산된 고유값을 통하여 이에 해당하는 고유 벡터를 구할 수 있습니다.

  • 나올 수 있는 고유값의 개수는 고유 공간의 차원의 수가 됩니다.

  • 행렬 $A$​​가 삼각행렬인 경우 고유값은 주 대각선 성분들의 곱으로 표현되어집니다.

    • $Au = \lambda_i u$

      $\prod^n_{i=1} \lambda_i(A) = det(A)$​n

      $\sum^n_{i=1} \lambda_i(A) = tr(A)$​

2. 고유값 분해(eigen decomposition)

  • $Av_i = \lambda_i v_i ,\quad i = 1, 2, 3, 4, \cdots n$

    $A[v_1, v_2 \cdots v_n] = [\lambda_1v_1, \lambda_2v_2 \cdots \lambda_nv_n] $​​

    $A[v_1, v_2 \cdots v_n] = [v_1, v_2 , \cdots, v_n]\begin{bmatrix}\lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix}$​​

    정방행렬 $A$​​​​의 고유 벡터들을 열벡터로, 고유 벡터들의 집합을 나타내는 행렬 $P$​​​​​, 고유값을 대각 원소로 가지는 대각 행렬 $\land$​​​​​ 라고 할 때, 다음과 같은 수식으로 표현이 가능합니다.

    $AP = P\land$​​

    $A = P\land P^{-1}$​​

    이와 같이 행렬 $A$​​를 자신의 고유 벡터들을 열벡터로 하는 행렬과 고유값을 대각원소로 하는 행렬의 곱으로 대각화 분해가 가능한데 이를 고유값 분해라고 부릅니다.

  • 고유값 분해가 가능한 조건은 행렬 $A$​가 $n \times n$​ 정방행렬이면서, $n$​개의 선형독립인 고유 벡터를 가지고 있어야 합니다.

    • $n \times n$ 정방행렬에서 선형 독립인 벡터의 개수가 $n$개라는 말은 행렬 $A$의 계수가 $n$이어야 한다는 의미로 $r(A) = n$이면 행렬 $A$​​는 비특이, 정칙행렬이어야 합니다.
  • $n \times n$​​인 두 행렬 $A$​​ 와 $\land$​​는 행렬 $P$​​​가 비특이, 정칙행렬이면 행렬 $A$​​와 행렬 $\land$​​는 닮음행렬입니다.

    • 행렬 $A$​와 $\land$​가 닮음행렬이면 서로 동일한 고유값을 지니며 각 고유값의 대수적 중복도 또한 같습니다.
    • $n \times n$인 정방행렬 $A$가 임의의 대각 행렬과 닮음 행렬이면 행렬 $A$​​는 대각화 가능(diagonalizable) 합니다.
      • 행렬을 대각화하게 되면 행렬식, 행렬의 거듭제곱, 역행렬, 행렬의 다항식을 계산하기 수월해집니다.
    • $n \times n$인 정방행렬 $A$가 대각화 가능하기 위한 필요충분조건은 행렬 $A$가 $n$​개의 선형독립인 고유 벡터의 집합을 가져야 합니다.
  • 대칭행렬과 고유값 분해

    • $n \times n$​​ 정방행렬 $A$​​중에서 $A = A^T$​​가 성립되는 대칭행렬이면 서로 다른 고유값에 대응하는 고유 벡터들은 서로 직교(orthogonal)하게 됩니다.

    • 직교행렬을 이용한 고유값 대각화가 가능해집니다.

      $A = P \land P^{-1}$​​ ​​

      $A = P\land P^T$​ , 단, $PP^T = E $​​ 인 경우

    • 행렬 $A$​​가 정방행렬이면서 대칭행렬이면 모두 고유값 분해가 가능합니다.

    • Gram-Schmidt (직교 대각화) 과정은 내적공간에서 유한개의 벡터 집합을 직교정규기저로 변환하는 방법입니다.

정리

  • 행렬 $A$가 $n \times n$ 정방행렬일 때, 행렬의 계수 $r(A)$가 $n$​ 보다 작으면 행렬 $A$는 비정칙, 특이(singular)행렬이고,
  • 행렬 $A$의 행렬식은 0이라서 역행렬이 존재하지 않는 비가역적(non-invertible)하고 고유벡터의 개수가 $n$개 보다 적기 때문에 대각화도 가능하지 않습니다.
  • 행렬 $A$의 행(열)벡터들은 서로 선형 종속의 관계를 가지고 있습니다.
  • 행렬 $A$를 기약행 사다리꼴로 변형하면 하나 이상의 행과 열이 0으로 채워져있습니다.

참고 사이트

  • https://bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-19-%ED%96%89%EB%A0%AC
  • https://darkpgmr.tistory.com/105
  • https://en.wikipedia.org/wiki/Eigendecomposition_of_a_matrix