2024/08/01 2

[데이터 과학책 정리] 2. 데이터 과학자가 갖춰야 할 능력

1. 실제적인 문제를 통계적으로 표현2. 컴퓨터 도구를 사용하여 시각화와 데이터 가공과 모형화 하기3. 그를 이용하여 실제적인 언어로  의미있는 결과를 만들어내는 능력4. 협업 능력, 소통 능력(읽고 쓰기 중요)5. 인문학적 지식, 사회 전반에 관한 관심과 폭넓은 독서 (행동 심리학, 경제학, 기술서 등의 논픽션 양서)

[데이터 과학책 정리] 1. 데이터 과학의 전반적인 과정

데이터 과학: 데이터를 사용하여 질문에 대한 합리적인 답을 내릴 수 있게 해주는 활동질문 ex) 병원 치료율을 높이는 방법은?, 비싼 와인이 더 맛있을까? 1. 문제 정의현실의 구체적인 문제를 명확하게 표현하고 통계적, 수리적 언어로 번역하는 작업ex) 어떤 변수들이 주택 가격을 결정 짓는지 알고자 할 때, 얼마나 안전한지, 상업지구인지, 학군이 좋은지, 가을 바라보는 전망 좋은 곳인지, 공장이 근처여서 공기가 좋지 않은지 등등의 변수를 고려해야 함.--> 문제 파악 후 수집해야 할 변수 정하기  2. 데이터 정의변수, 지표 등을 정의  3. 실험계획 or 표본화실험 계획: 실험/통제 집단을 어느 정도 크기로 정의할지를 정하는 것 같은 문제를 결정하는 분야표본화: 모집단을 대표하는 표본을 얻기 위한 것(..