[데이터 과학책 정리] 1. 데이터 과학의 전반적인 과정
데이터 과학: 데이터를 사용하여 질문에 대한 합리적인 답을 내릴 수 있게 해주는 활동질문 ex) 병원 치료율을 높이는 방법은?, 비싼 와인이 더 맛있을까? 1. 문제 정의현실의 구체적인 문제를 명확하게 표현하고 통계적, 수리적 언어로 번역하는 작업ex) 어떤 변수들이 주택 가격을 결정 짓는지 알고자 할 때, 얼마나 안전한지, 상업지구인지, 학군이 좋은지, 가을 바라보는 전망 좋은 곳인지, 공장이 근처여서 공기가 좋지 않은지 등등의 변수를 고려해야 함.--> 문제 파악 후 수집해야 할 변수 정하기 2. 데이터 정의변수, 지표 등을 정의 3. 실험계획 or 표본화실험 계획: 실험/통제 집단을 어느 정도 크기로 정의할지를 정하는 것 같은 문제를 결정하는 분야표본화: 모집단을 대표하는 표본을 얻기 위한 것(..