본문 바로가기
KT Aivle School 5기

미니 프로젝트 1차 / 유통고객 데이터 전처리 / 토익 점수 데이터 전처리, 탐색

by 앵유짱 2024. 5. 7.

에이블스쿨 5기 첫 대면!
처음으로 같이 대면하고 프로젝트했던 우리 23조 조원
MBTI 맞추기 놀이하고 쭈뼛대며 친해졋던 나날들.. 
 ╰(*°▽°*)╯

조원들이 다들 멀리살아서 중앙인 홍대에서 만났다
스터디룸은 홍대입구역에서 가까웠던 카페 모각으로 ~
공간이 넓찍하고 큰 모니터로 강의도 같이 들을 수 있다
7명 / 9~18시 / 108,000원

 

스터디 카페 모각 : 네이버

방문자리뷰 25 · 블로그리뷰 3

m.place.naver.com

 

구씨네부엌 : 네이버

방문자리뷰 822 · 블로그리뷰 968

m.place.naver.com



미니 프로젝트 1차는 아래와 같이 이루어졌다

  • 구매패턴을 통한 이탈고객 예측 데이터 전처리
  • 토익점수 예측 전처리, 데이터탐색
  • cheat sheet 만들기

 


 

  • 구매패턴을 통한 이탈고객 예측 데이터 전처리

 
groupby, merge 등등 자주 쓰이는 메서드가 많았다
그 중 연령대를 추가하는 것은 처음해봐서 기록겸 남겨두기로~~
 

문제) 고객의 태어난 연도를 활용하여 'Age'(고객 나이) 컬럼을 추가 합니다. (현재 : 2016년)
문제) 고객이 몇십대 인지 'Age' 컬럼을 활용하여 'AgeGroup'(연령대) 컬럼을 추가 합니다.

# 고객나이(Age) 추가
# 2016년 - 고객의 태어난 연도
customers['Age'] = 2016 - customers['BirthYear']

# 연령대(AgeGroup) 추가
# 연령대 = 나이 / 10 * 10
customers['AgeGroup'] = (customers['Age'] // 10) * 10

좌 : 고객나이(Age) 추가 결과 / 우 : 연령대(AgeGroup) 추가 결과

 


 

  • 토익 점수 데이터

 
전처리는 유통고객 데이터와 비슷하게 이루어졌고
토익데이터는 데이터 탐색이 더해졌고 아래와 같은 결과를 얻었다

  • 토익 학습목표는 자기계발이 가장 많음
  • 80년대 중반~00년생 중반까지 응시자의 나이는 다양했음
  • 특히 2016년 기준 92년생이 가장 많았음

 


 
더 다양한 탐색을 진행할 수 있었지만 프로젝트 시간이 종료되어 마무리하였다
그 대신 우리 23조는 전처리에 시간을 더 많이 투자했다는 장점이~
그래서 좀 더 꼼꼼한 전처리 방법을 공부할 수 있었다 :>
 

 
5시 반 칼퇴하고 조원들과 헤어지며 찍은 사진..
날씨 is this real?