반응형 머신러닝12 회귀 모델 - 규제 선형 회귀 모델 선형 회귀 모델의 과대적합(Overfitting) 과대적합(overfitting) : 모델이 지나치게 학습 샘플에 편향되어, 새로운 입력에 적절히 예측을 하지 못하는 문제 과소적합(underfitting) : 모델의 복잡도가 부족하여 학습 샘플의 입출력 관계를 충분히 설명하지 못하는 문제 다중 선형 회귀 모델의 과대적합 선형 회귀 모델은 기본적으로 모든 특징이 타겟과 선형 관계에 있다고 가정하기 때문에 과대적합이 발생하는 경향이 있습니다. 과대적합의 해결 방법으로는 과도한 선형 관계에 대한 가정을 억제하면 과대적합을 방지하는 효과가 있습니다. 다중 선형 회귀 모델의 과대적합의 예시 두 변수에 대한 다중 선형 회귀 모델의 학습 결과 x1 변수는 y 변수와 선형적인 관계가 거의 없음에도 불구하고, 모든 입력.. 2022. 8. 19. 머신 러닝 - 회귀 분석 회귀 분석(Regression Analysis) 연속적인 출력 값을 예측하는 통계 분석 방법입니다. 1886년 프랜시스 골턴의 연구에서, 세대가 흘러도 자녀의 키는 전체의 평균으로 회귀하는 것을 관찰한 것에서 단어가 유래되었습니다. 회귀 분석의 입력 형식은 모델에 따라 다양한 형식이 될 수 있습니다. 예를 들면, 특징(feature), 예측 변수(predictor variable), 설명 변수(explanatory variable) 등이 있습니다. 회귀분석의 출력은 연속적인 출력 값이 됩니다.(실수값, 스칼라 값) 또한, 타겟(target), 반응 변수(response varialbe), 결과(outcome) 등도 회구 분석의 출력이 될 수 있습니다. 선형 회귀(Linear Regression) 선형적인.. 2022. 8. 19. 머신 러닝 프로세스 머신러닝 프로세스 머신 러닝은 데이터의 수집으로부터 시작됩니다. 모델을 학습한 후에는 모델의 적합 여부를 평가하고, 성능이 기준에 미달할 경우 원인을 찾아 개선 활동을 합니다. 학습된 모델은 시간이 지날수록 예측 성능이 하락하는 특성이 있기 때문에, 지속적으로 모델을 평가하여 성능이 하락한 경우에는 최신 데이터로 모델을 재학습합니다. 데이터 수집(Data Collection) 머신 러닝 알고리즘의 성능에 가장 큰 영향을 주는 단계입니다. 데이터의 질이 떨어지면 알고리즘의 성능도 저하됩니다. 그렇기에 양질의 데이터를 수집하는 것이 중요합니다. 데이터의 특성에 따라 다양한 방법으로 데이터를 취득하는데요. 다음과 같습니다. - 센서 데이터 : 데이터 수집 장비를 사용해서 취득하게 됩니다. - 영상 데이터 : .. 2022. 8. 18. 인공지능, 머신러닝, 딥러닝이란 인공지능 vs 머신 러닝 vs 딥러닝 세 용어 중 인공 지능이 가장 넓은 범주에 속합니다. 머신 러닝의 핵심은 데이터와 규칙의 학습의 유무입니다. 직접 행동 조건을 프로그래밍하는 것은 머신 러닝이라고 하지 않습니다. 인공지능(Artificial Intelligence ; AI) 컴퓨터가 사람의 행동을 모방하도록 하는 연구입니다. 튜링 테스트를 통해 인공 지능의 수준을 평가할 수 있습니다. 튜링 테스트는 1950년대 앨런 튜링이 제안한 기계에 지능이 있는지 판별하는 방법입니다. 초기 연구에서는 규칙 기반의 연구가 주를 이루었는데요. 인공 지능은 보통 강 인공 지능(strong AI)을 의미합니다. - 강 인공지능(strong AI) : 인간과 같이 감각, 사고력, 의식을 갖춘 인공 지능을 의미합니다. - .. 2022. 8. 18. 이전 1 2 3 다음 반응형