파이썬 기술통계, 데이터타입 확인, 데이터타입 변경

낭만적(?) 일상/파이썬, 데이터분석

파이썬 기술통계, 데이터타입 확인, 데이터타입 변경

Soo♥JJeong 2019. 6. 27. 15:27

JupyterLab(또는 JupyterNotebook)에서 데이터를 불러왔다면(파싱했다면), 이제 기술통계를 확인하고, 데이터 타입을 확인해봐야한다.

df2.describe() #기술통계 확인
df2.dtypes #데이터 타입 확인

어떤 것에는 ()를 붙이고, 어떤 것은 안붙이는지 기준을 잘 모르겠다. 익숙해지는 것만이 답인듯하다.

describe()를 실행하면 가끔 기술통계가 나와야하는데 나오지 않는 경우가 있다. 그 이유는 데이터 타입이 int(숫자)가 아니기 때문! 아래 예제 데이터는 공공데이터포털에서 가져왔다고 하는데, 데이터타입이 무려 문자형이다. (공공데이터 포탈에 데이터 업로드 하는 모든 분들에게 데이터타입에 대한 교육이 시급해보인다.)

오마이갓. 맨 위 숫자 표에 있는 콤마(,)는 모두 텍스트로 찍었다는거다. 그렇다면, 데이터타입을 변경해줘야겠지.

* 콤마(,)를 삭제하고 데이터타입을 문자에서 숫자(int)로 바꾸는 코드

df2[df2.columns[2:]] = df2[df2.columns[2:]].apply(lambda x : x.str.replace(',','').astype(int))

먼저 밑줄친 df2.columns[2:]의 의미는 'df2의 컬럼명을 2번째부터 끝까지 가져와라' 그리고 밑줄 안친 df2는 df2에 밑줄친 것을 넣으라는 뜻이다.

apply : 모든 원소에 적용하겠다는 메소드

lambda x : ':' 뒤에 오는 내용이 사용자가 만든 함수

replace(수정전, 수정후) : 수정전을 수정후로 바꿔라

astype(int) : 자료형을 int로 변경하겠다

결과창을 보면, 콤마가 빠지고 데이터들이 숫자형으로 바뀐 것을 확인할 수 있다.

* 위 내용은 내돈내고(!) '드립력으로 머신러닝 배우기 중급반' 에서 배운 내용이다.

** 혹시 수정되어야 할 부분이 있으면 댓글로 알려주세요! (저도 공부하는 중입니다 ^^)

저작자표시 비영리 변경금지

'낭만적(?) 일상 > 파이썬, 데이터분석' 카테고리의 다른 글

파이썬 전처리③정규화(normalization)로 scale맞추기 (2)	2019.06.29
파이썬 전처리②표준화(standardization)로 이상치제거 (2)	2019.06.28
파이썬 전처리①결측치 확인, 결측치 처리(제외)하기 (5)	2019.06.27
파이썬(주피터)에서 엑셀,CSV 파일 불러오기 쉬운방법! (0)	2019.06.25
python tensorflow설치 방법 (0)	2019.06.23

현재글파이썬 기술통계, 데이터타입 확인, 데이터타입 변경

낭만적 일상

작은 결혼식 준비 과정, 그 후의 일상과 여행

rescaling, 패스트캠퍼스, 데사스, 스몰웨딩, Python, 서울연구원 결혼식, 파이썬, 요나고 여행, 오블완, 티스토리챌린지, 동부여성발전센터 수영장, 시민청 결혼식, 셀프웨딩, 마이리얼트립할인코드, 수영일기, 돗토리 여행, 경험수집잡화점, 데이터사이언스스쿨, 일본 소도시여행, 자유형 측면호흡,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

낭만적 일상