데이터의 분석 과정?

문제점 찾기 -> 데이터 모으기 ->  데이터 분석하기 -> 데이터 모델링하기 -> 모델데이터 혁명? -> 시각화 -> 시스템 만들기 

 

데이터 분석프로세스

Data 준비 => EDA ? (탐색적 분석)[PCA, 다중공선성, 시각화] => Dimensionality Reduction [변수 선택, 변수 축소]

 

Insupervised learning [Association, clustering]=> Supervised learning[Regression, Classification, Time Serise] => Optimization [Convex, Optimuzation] => Evaluation[Confusion Matrix, ROC]

 

변수가 많으면 예외가 나온다 ( 이유 널 값 및 값이무의미함이 있기 때문에)

 

 

데이터 컬럼 (값아닌가? ) 

 

통계학 용어

검정 = 검정 마즈막

추정 = 추정 마즈막

분산 =  평균에서 떨어진 정도

신뢰구간 = 

분포

독립변수 = 재료

종속변수 = 알고자 하는것

\\

 

분석을 위한 3가지 기법

분류 군집화 예측

예측

 

지도학습

비지도학습

 

classification 

 

clustering

regression

블로그 이미지

Or71nH

,