본문 바로가기

차원축소2

[ISLR] Chapter6. Linear Model Selection and Regularization - Intro 다음 내용들은 아래의 책 ISLR 책을 해석하면서 공부한 내용임을 먼저 말씀드립니다! ( 사진에 링크 연결 ) 위의 식은 우리가 흔히 보는 linear model이다. linear model은 주로 X들과 Y 사이의 관계를 보고 싶을 때 주로 사용된다. Chapter 3에서 우리는 주로 회귀계수를 추정할 때, Least squares (최소 제곱 법)를 사용했다. linear model의 가장 큰 이점은 "해석력"을 꼽을 수 있다. 그리고 현실 문제에서 놀랍게도 non-linear methods와 비교했을 때 경쟁력이 있다. 그래서 우리는 이번 Chapter 6에서는 Least squares에 다른 어떤 것을 추가함으로써 simple linear model을 향상시키는 방법들에 대해서 배워볼 것이다. 자.. 2021. 7. 12.
[PCA]Principal Components Analysis 주성분분석 - JoJo's Blog " Principal Components Analysis (PCA) " 이 글은 고려대학교 김성범 교수님의 유튜브 강의를 참고하여 작성한 내용입니다. https://youtu.be/FhQm2Tc8Kic 실제 데이터 분석을 하다보면 변수가 너무 많아서 머부터 시작해야 될지 혹은 이 변수들을 모두 사용해야 할지 고민하다 보면 어느새 하루가 지나가죠... º_º 오늘은 이 고민을 해결해 줄 PCA에 대해 알아보겠습니다. p=100인 위의 데이터를 분석 해야한다고 가정해보자 초기에는 데이터의 전반적인 분포를 확인해야 하는데, 변수가 너무 많을 때 즉, 고차원의 데이터를 만났을 때 우리가 할 수 있는 방법은 무엇이 있을까? 그전에, 고차원의 데이터는 왜 분석하는데 어려움이 있을까? 첫 번째) 3차원 이상의 데이터.. 2021. 7. 8.