데이터의 분석 과정?
문제점 찾기 -> 데이터 모으기 -> 데이터 분석하기 -> 데이터 모델링하기 -> 모델데이터 혁명? -> 시각화 -> 시스템 만들기
데이터 분석프로세스
Data 준비 => EDA ? (탐색적 분석)[PCA, 다중공선성, 시각화] => Dimensionality Reduction [변수 선택, 변수 축소]
Insupervised learning [Association, clustering]=> Supervised learning[Regression, Classification, Time Serise] => Optimization [Convex, Optimuzation] => Evaluation[Confusion Matrix, ROC]
변수가 많으면 예외가 나온다 ( 이유 널 값 및 값이무의미함이 있기 때문에)
데이터 컬럼 (값아닌가? )
통계학 용어
검정 = 검정 마즈막
추정 = 추정 마즈막
분산 = 평균에서 떨어진 정도
신뢰구간 =
분포
독립변수 = 재료
종속변수 = 알고자 하는것
\\
분석을 위한 3가지 기법
분류 군집화 예측
예측
지도학습
비지도학습
classification
clustering
regression