[프로그래머를 위한 선형대수] Review (1)
도입
데이터 사이언스에 있어서 선형대수는 필수라고 하기에 책 읽기를 시작했다
선형의 의미가 무엇인지, 어떤 부분에서 선형대수가 쓰이는지를 알아가는 것을 목표로 하겠다.
데이터를 공간 속의 점이라고 생각하면 직관이 먹힌다.
선형대수는 선형적 (직선이나 평면처럼 곧은 것)을 다룬다.
곧기에 쉽고 예측하기 좋고 명쾌한 결과를 얻을 수 있다.
______________________________________________________________________________________________________________________________
1장 벡터, 행렬, 행렬식
[A] 벡터공간
등장하는 기본 개념
- 벡터 - 화살표 또는 공간의 점
- 행렬 - 공간에서 공간으로의 직교 사상
- 행렬식 - 위의 사상에 따른 부피 확대율
- 횡 벡터 - 가로 벡터
- 종 벡터 - 세로 벡터
- 벡터 연산 - 덧셈과 스칼라 배
- 선형 공간 or 벡터 공간 - 덧셈과 정수배가 정이 된 세계로 길이나 각도가 정의되어있지 않다
- 기저 - basis 벡터(선형 공간을 구성하는 최소한의 벡터)들의 집합
<기저의 조건>
1. 각 기저 벡터가 독립 = 나타내는 방법은 한 가지 = 토지 하나에 번지는 하나
2. n차원 공간을 벡터로 (선형 결합) 표현 가능 = 기준 벡터에 번지를 매겨 위치를 정함
= 어떤 벡터라도 기저 벡터로 나타낼 수 있음 = 모든 토지에 번지가 붙어있음
위 전체를 관통하는 간단한 예시로
백두산의 높이를 3000m라고 표현했을 때, 3000은 좌표(번지), m는 기저(토지)이다.
만약 m(토지)가 feet로 바뀔 경우 9842.52(번지)도 바뀐다.
______________________________________________________________________________________________________________________________
[B] 행렬과 사상
등장하는 기본 개념
- 정방 행렬 - n x n 꼴 행렬
- 영행렬 = o
- 단위행렬 = I
- 대각 행렬 = diagonal
- 역행렬 - AA^-1 = I를 만족하는 행렬 A^-1
역행렬은 이동점 y를 가지고 원래점 x를 구하기 위함이다
역행렬은 있을 수도 없을 수도 있다.
ex ) y 공간이 납작하게 눌린 경우 원래점 x를 찾을 수가 없다
행렬이란 선형 사상을 좌표 성분으로 표시한 것이고, 행렬의 각 열은 기저 벡터의 목적지를 나타낸다
행렬(요소)과 벡터(요인)의 관계는 순수한 관계이다 y = Ax
순수한 관계란 상승효과나 규모에 의한 변화가 없다
즉, 벡터의 덧셈과 정수배를 제대로 유지한다는 말이다.
사상이 같으면 행렬도 같다
같은 크기의 행렬 A, B가 임의의 벡터 x에 대해 항상 Ax = Bx를 만족한다면 A = B이다
________________________________________________________________________________________________________________
[C] 행렬식과 확대율
행렬식은 det A로 표기하고, y로 옮겨진 선형 공간의 부피 확대율을 의미한다.
행렬식이 0이면 납작해짐을 의미하고 이때 역행렬은 없다
아래 두 가지의 경우 선형 공간이 납작해진다
두 열이 선형 관계인 경우, 기저 벡터 하나가 줄어들기에 차원이 줄어들고 납작해진다.
어딘가의 열이 모두 0인 경우, 기저 벡터 하나가 없는 상태이므로 납작해진다.
유용한 성질
- 어느 열의 정수 배를 다른 열에 더해도 값은 안 바뀐다
- 행렬식의 성질은 행과 열의 역할을 모두 바꿔도 (전치) 성립한다
- 다중 선형성 : det(cA) = cⁿ det(A)
- 두열을 바꾸면 부호가 역전된다
행렬식 계산 방법은 다양한데 생략하겠다... 어차피 컴퓨터가 다해주니깐
________________________________________________________________________________________________________________
마무리
책을 문장을 하나하나 읽으면서 이해가 안 된다면, 될 때까지 읽어야 된다.
일본어를 한국어로 옮긴 번역본 책이라 그런지 문장 하나하나가 어수선하거나 한국말로 쓰여 있는데 말이 이상한 경우가 많았다.그러다 보니 하나의 챕터에서 전하고자 하는 내용은 정말 단순한 내용임에도, 읽으면서 매우 어렵게 느껴질 수 있다.이런 경우 다음 챕터로 넘어가기보다 해당 부분을 계속 읽어보고 안되면 다음날 읽어보고 이런 식으로 진행하면 어느 정도 답답함이 풀릴 것이다.
원래는 따로 노트에 필기하면서 책을 읽을 생각이었는데 추가로 블로그에 글을 쓰는 게 더 장기기억화 될 것 같고,체계를 잡으면서 공부를 하는 것이 좋을 듯해 블로그에도 글을 쓴다.
일반 강의에선 선형대수를 하나의 수학 과목처럼 느껴지고 개념이 데이터와 어떤 연관이 있는지 잘 이해는 안 갔으나,
이 책을 통해서 어느 정도 이해해 나가고 있다.
'Machine Learning' 카테고리의 다른 글
[프로그래머를 위한 선형대수] Review (3~4) (79) | 2022.02.08 |
---|---|
지금까지 캐글을 시작하지 못햇던 이유 (34) | 2022.02.07 |
[프로그래머를 위한 선형대수] Review (2) (6) | 2022.02.05 |
금융데이터와 머신러닝의 결합 실패 이유 - Qraft Technoledge (34) | 2022.01.08 |
Project : QQQ Price Predict (3) | 2021.10.05 |