본문 바로가기

ML7

Maximal Covering Location Problem(MCLP) 알고리즘 최근 COMPAS에서 주관한 "광양시 자동분리수거기 최적의 위치 선정" 공모전에 참여하였다. 최종 입지 선정 과정에서 사용한 MCLP 알고리즘에 대해 자세히 알아보려고 한다. 공간 입지 모델링이란? 시설물의 입지 결정에 영향을 주는 요인은 다양하지만, 그중 수요의 분포, 서비스의 도달 범위 같이 양적으로 측정할 수 있는 요인도 있고, 정치적 요인, 공공성, 형평성, 시설물 또는 서비스 운영 요원의 숙련도와 같이 질적 측면의 요인도 존재한다. 시설물의 적합한 입지를 결정하기 위해서는 양적 인자와 질적 인자를 모두 고려해야 한다. 이때, 공간 입지 모델링을 통한 입지 선정은 양적인 측면과 여러 제약 조건을 동시게 고려하여 최적에 가까운 입지를 선정하는 훌륭한 수단이다. 즉, 공간 입지 모델링은 시설물 서비스.. 2021. 9. 16.
의사결정나무(Classification&Regression)-JoJo's Blog 이 글은 고려대학교 김성범 교수님의 유튜브 강의를 참고하여 작성한 내용입니다. https://youtu.be/xki7zQDf74I [핵심 머신러닝] 의사결정나무모델 1 (모델개요, 예측나무) https://youtu.be/2Rd4AqmLjfU [핵심 머신러닝 ] 의사결정나무모델 2 (분류나무, Information Gain) 의사결정나무 모델이란? : 데이터에 내재되어 있는 패턴을 변수의 조합으로 나타내는 예측/분류 모델을 나무의 형태로 만드는 것 : 스무고개 놀이와 비슷한 개념 : 핵심은 데이터를 2개 혹은 그 이상의 부분집합으로 분할 : 데이터가 균일해지도록 분할 >> ★균일에 기준이 회귀와 분류마다 다름★ : 분류는 비슷한 범주를 갖고 있는 관측치들끼리 (분류 균일) : 회귀는 비슷한 수치를 갖고 .. 2021. 8. 9.
[ISLR] Chapter6. Linear Model Selection and Regularization - Intro 다음 내용들은 아래의 책 ISLR 책을 해석하면서 공부한 내용임을 먼저 말씀드립니다! ( 사진에 링크 연결 ) 위의 식은 우리가 흔히 보는 linear model이다. linear model은 주로 X들과 Y 사이의 관계를 보고 싶을 때 주로 사용된다. Chapter 3에서 우리는 주로 회귀계수를 추정할 때, Least squares (최소 제곱 법)를 사용했다. linear model의 가장 큰 이점은 "해석력"을 꼽을 수 있다. 그리고 현실 문제에서 놀랍게도 non-linear methods와 비교했을 때 경쟁력이 있다. 그래서 우리는 이번 Chapter 6에서는 Least squares에 다른 어떤 것을 추가함으로써 simple linear model을 향상시키는 방법들에 대해서 배워볼 것이다. 자.. 2021. 7. 12.
[PCA]Principal Components Analysis 주성분분석 - JoJo's Blog " Principal Components Analysis (PCA) " 이 글은 고려대학교 김성범 교수님의 유튜브 강의를 참고하여 작성한 내용입니다. https://youtu.be/FhQm2Tc8Kic 실제 데이터 분석을 하다보면 변수가 너무 많아서 머부터 시작해야 될지 혹은 이 변수들을 모두 사용해야 할지 고민하다 보면 어느새 하루가 지나가죠... º_º 오늘은 이 고민을 해결해 줄 PCA에 대해 알아보겠습니다. p=100인 위의 데이터를 분석 해야한다고 가정해보자 초기에는 데이터의 전반적인 분포를 확인해야 하는데, 변수가 너무 많을 때 즉, 고차원의 데이터를 만났을 때 우리가 할 수 있는 방법은 무엇이 있을까? 그전에, 고차원의 데이터는 왜 분석하는데 어려움이 있을까? 첫 번째) 3차원 이상의 데이터.. 2021. 7. 8.