2024/08/06 2

[데이터 과학책 정리] 4. 변수 분석하기/데이터 요약 정보 확인

책에서는 names(boston) 그러나 내가 다루는 데이터에는 이미 변수명이 할당되어있어 이 과정이 따로 필요하진 않다.그런데 변수명이 뭔지는 짚고 가야할 것 같아서 변수명에 대해 알아보려고 한다.내가 다운받은 데이터는 uci 머신러닝 리포 사이트에 있는 'wine_quality" 라는 데이터다. 변수는 총 12개다. 1. 변수 분석하기 1. fixed.acidity: 비휘발성 산도, 와인과 관련된 대부분의 산2. volatile.acidity: 휘발성 산도. 와인에 함유된 아세트산의 양. 너무 높으면 불쾌한 식초맛이 남3. citric.acid: 구연산. 소량으로 발견되며, 와인에 풍미를 더할 수 있음.4. residual.sugar: 잔여 당분. 발표가 멈춘 후 남은 설탕의 양, 1g/L 미만의 와..

[데이터 과학책 정리] 3. R에서 data 불러오기 (csv 파일, 큰 외부 파일, 엑셀 파일)

csv 파일이 가장 상세히 설명될 예정이다. 큰 외부 파일, 엑셀 파일 불러오는 방법은 아래에서 간단히 다루도록 하겠다.  1. 데이터 다운 구글에 'uci 머신러닝 리포'를 검색한 후 제일 상단에 뜨는 영어 사이트에 들어간다 데이터 다운 (필자는 실습용이지만 재밌어보이는 걸로 고름.  와인 품질 데이터 다운 받음)csv 파일 열어서 상태 확인해줌 (생각보다 예쁘게 정리 안되어있음)이 파일 자체를 고치진 말고 R에서 불러올 때 고쳐서 불러오면 된다.다음 단계에서 알아보도록 하자.   2. 데이터 잘 불러오기  R을 실행한다  > read.csv()와 read.table()로 사용할 수 있는데, read.csv()는 read.table() 함수를 실행하되 header=TRUE, sep=","  옵션이 기본..