낭만적(?) 일상/세미나, 교육

드립력으로 배우는 머신러닝 기초반, 기초아니야반 수강후기

Soo♥JJeong 2019. 6. 21. 17:18

드립력으로 배우는 머신러닝의 기초반, 기초아니야반에 이어 이제 중급반까지 듣고 있다. (어느새 지난주에 1주차 수업을 해버렸음) 기초반 때는 매주 후기를 썼는데, 기초아니야반 때는 슬럼프가 찾아왔는지, (+게을러진것도 있음) 리뷰를 남기지 못했다. 그래도 기초반, 기초아니야반까지 끝내고 난 후기를 꼭 남겨야겠다는 생각이 들었다.

 

 

 

  기초반과 기초아니야 반의 공통점과 차이점

 

 

기초반

기초아니야 반 

공통점

주1회

수업시간

1회에 3시간

1회에 2시간씩

수업방식

통계이론+중간에 팀플

(20분 정도안에 해결가능한 과제)

파이썬 코딩 기초 문법 실습

(colab 활용, 팀플은 1도 없음)

과제

없음. 그러나 복습 필수!

매주 있음 (종강날은 없음)

노트북 필요

없어도 되나, 있으면 좋음.

필수!

 

 

 

 

  기초반 주차별 수업내용

1주차 : 안들어서 모름. (1주차 수업이 끝났을 때 이 수업을 발견했다.)
2주차 : 건강보험공단 허리둘레 영향주는 변수 찾기 : 표준화(outlier제거)
3주차 : 월마트 holiday여부에 따른 매출 차이(T검정)
4주차 : 월마트 연도별차이 (F검정), 상관분석, 회귀분석 

 

 

개인적으로 기초반 수업내용이 너무 좋았다. 반면, '기초아니야'반은 타 학원 수업과 비슷하다.

 

 

  기초아니야 주차별 수업내용


1주차 : 파이썬 쌩기초
2주차 : numpy -- 엑셀
3주차 : pandas -- 엑셀고급 (시리즈, data frame) * 3주차 과제가 멘붕이다. 4주차 수업에 갈지말지고민된다.
4주차 : 기초반에서 엑셀로 검정했던 월마트 T검증을 파이썬에서 실행.

 

 

[4주차에 실행한 코드 : 수업시간에 직접 짠다]

 

1. 데이터 확인하기
df = data1.copy  #data를 copy하여 df로 선언
df.columns        #df에는 어떤 컬럼이 있는지 확인
df.dtypes          #각 컬럼의 데이터타입 확인하기
df.index            #index의 데이터타입이 datetype인지 확인하기
df.describe()      # 각 컬럼별 기술통계 확인
df['2010'].describe()  #2010년도의 데이터만 가져와서 기술통계 내기

 

2. null값 확인하기
df2=df.copy()       #df를 카피하여 df2로 선언
df2.isnull().sum()  #df2 각 컬럼에서 null값 갯수 확인(sum해서 보면 편함)

 

3. 지점별 매출 확인
df3=df2.copy()
df3_pivot = dr3.pivot_table(values = ['Weekly_Sales'], index =['Store'], aggrefunc=np.mean)
df3_pivot.head()


4. 표준화하기
from scipy import stats  #scipy의 stat을 임포트
df4=df3.copy()
df4['z_sales'] = stats.zscore(df4['Weekly_Sales'])  #df4 마지막컬럼에 z_sales 컬럼추가, 해당 컬럼에 df4의 Weekly_Sales컬럼값을 표준화(z)한 값 넣기
df4.head()

 

5. outlier제거
df5=df4.copy()
df5=df5[df5['z_sales'].between(-2,2)] #df5에 z_sales컬럼 값이 -2부터2까지(1.96반올림) 데이터만 가져오기
df5.head()
df5.describe()
df5.groupby(df5['IsHoliday'])['Weekly_Sales'].mean()
df5.groupby(df5['IsHoliday'])['Weekly_Sales'].std()    #표준편차구하기

 

 

6. T검증
hol = df5[df5['IsHoliday'] == True]['Weekly_Sales']
non_hol = df5[df5['IsHoliday'] == False]['Weekly_Sales']
stat.ttest_ind(hol, non_hol)

 

 

 

기초아니야는 파이썬 기초만 배우고 실제 모델링은 중급반에서 한다.

 

 

 

 

기초아니야 단점

1주 2시간의 짧은 수업시간 때문인지 수업에서 못다루는 내용이 많다. 관련 자료는 colab으로 공유해주는데, 따로 공부해야할게 많다. 혼자 보면 눈에 잘 안들어온다. ㅠㅠ 3주차 과제 엄청 많음.

 

 

기초아니야 장점

어쨌든 한주에 1개씩 진도를 나간다. numpy, pandas, 그리고 기초반에서 엑셀로 T검증했던 것을 마지막주에 파이썬으로 실습해본다. 

 

 

총평 & 꿀팁

- 기초반을 듣고 기초아니야반을 들으면 약간의 실망감이 있을 수 있다.  (그만큼 기초반의 임팩트가 강해서이지, 기초아니야반이 별로인건 아니다.)

- 기초아니야를 들으면, 뭔가 중간에 하다만 느낌이 들어서 중급반까지 들어야겠다는 생각이 든다. 

- 기초아니야반이 상시로 열리지 않는다. 일요일 5~7시에 기초아니야반과 중급반이 번갈아서 열린다. (나는 운이 좋게 기초반-기초아니야-중급반을 쭉 듣게 됨)

- 탈잉에도 동일한 강좌가 있으나, 탈잉은 10%부가세가 별도로 붙는 반면 온오프믹스는 부가세가 붙지 않는다. 가장 할인을 많이 받는 방법은 일찍 & 같이 들을사람을 만들어서 얼리버드 결제&지인 할인받는 것! (일찍 결제하면 최대12%, 지인이 함께 들으면 추가 5%할인이 된다. 난 처음에 이것을 몰랐음..)

 

 

이상 내돈주고 들은 '드립력으로 배우는 머신러닝 기초반, 기초아니야반' 후기 끝!