본문 바로가기
KT Aivle School 5기

미니 프로젝트 2차 / 서울시 생활정보 기반 대중교통 수요 분석

by 앵유짱 2024. 5. 8.

 

 

1차때 같은 조였던 에이블러 행님이 주신 페레로로쉐
이번에도 같은조~~
정말 달콤해~~ (. ❛ ᴗ ❛.) 

예전에 같은 조였던 조원들도 근처래서 점심 같이먹었다 
홍대 돈수백~ 맛있었다 ㅎㅎ 깍두기가 시원해

조원들이 다들 멀리살아서 중앙인 홍대에서 만났다
스터디룸은 홍대입구역에서 가까운 다다스터디룸 홍대점~
공간이 조금 좁았지만 큰 모니터로 강의도 같이 들을 수 있다

6명 / 9~18시 / 90,000원

 

다다스터디룸 홍대점 : 네이버

방문자리뷰 83 · 블로그리뷰 9

m.place.naver.com

 

돈수백 홍대직영점 : 네이버

방문자리뷰 1,727 · 블로그리뷰 747

m.place.naver.com



미니 프로젝트 2차는 데이터 다루기, 다듬기, 분석, 수집을 배운 후 시작된다
이번 미프는 '서울시 생활 정보 기반 대중교통 수요 분석'에 관한 프로젝트고 4단계로 구분된다
 
프로젝트의 주제는 4단계를 거쳐
'어느 자치구에 노선과 정류장수를 증설하면 좋을지' 분석하는 것!


단계 구분과 사용 데이터
 

  1. 구별 버스정류장 분석
    • 버스노선별, 정류장별 승하차 인원 정보 데이터
    • (추가)버스정류장 위치정보 데이터
  2. 구별 유동인구 분석
    • 구별 이동 데이터(2024.1)
  3. 구별 주민등록인구 분석
    • 서울시 주민등록 데이터
  4. 구별 업종등록 분석
    • 구별 등록 업종 상위 10개 데이터

분석 내용
 

1. 구별 버스정류장 분석

자치구별 노선 및 정류장 수

노선수와 정류장수 차이가 가시적으로 보이는 지역
➡️ 강동구, 강서구, 노원구, 서대문구, 종로구, 중구


승하차평균 승객수

➡️ 어느 역이나 승하차평균승객수는 거의 비슷


정류장당 노선수 그래프(노선수/정류장수)

 정류장과 노선수의 비율이 궁금해서 구해보았다
➡️ 중구>>종로구 으로 상대적으로 노선이 많아 정류장을 더 지어야 함
➡️ 강동구>강서구>노원구 순으로 상대적으로 정류장이 많아 노선을 더 지어야 함


노선당 총 승객수, 정류장당 총 승객수

 승객 수를 기준으로 노선당 총 승객수와 정류장당 총 승객수를 살펴 보았음
정류장당 노선수와 비슷 결과를 얻을 수 있었음
➡️ 중구>동대문구>강남구>종로구>관악구 순으로 정류장을 더 지어야 함
➡️ 강동구>송파구>강서구>관악구 순으로 노선을 더 지어야함


 

2. 구별 유동인구 분석

자치구별 이동인구와 평균이동시간

 ➡️ 예상했듯이 강남구, 송파구, 서초구로 이동하는 인구가 많음
➡️ 어디로 이동하든 이동 시간의 평균은 비슷


 

 
이동 유형별 비율 분석 (상위 5개)
 
이동 유형별 비율
➡️ HH, WW의 비율이 10%로 낮은 편
➡️ 전체적으로 기타의 유입 유출이 많음
 
낮 이동 유형별 비율
➡️ 예상했듯 심야보다 W의 비율이 높음
 
심야 이동 유형별 비율
➡️ 집과 관련된 활동이 73%나 차지
      - (OH의 비율+HO의 비율)
➡️ EH유형(외부-집)이 가장 많음(26%)
 

* E : Etc(기타지역)
* H : Home(야간 상주지) 
* W : Work(주간 상주지)
* ex ) HH : H-H간 이동
* ex ) OH : H가 뒤에오는 이동유형

 


 

3. 구별 주민등록인구 분석

자치구별 주민등록수 합계

 자치구별 주민등록수 합계
➡️ 송파구>강서구>강남구 순으로 주민등록수가 많음
 


 

4. 구별 업종등록 분석

자치구별로 분석한 등록업종별 사업체수와 종사자수

 등록업종별 사업체수와 종사자수 그래프
raw데이터의 업종은 아래 항목의 10개였으나
데이터 양이 많고 유의미한 업종 5개로 추려서 분석함


➡️ 포함항목 : 한식점, 카페, 호프, 학원, 고깃집
➡️ 제외항목 : 개인택시, 용달, 부동산, 미용실, 옷가게
 
그런데 딱히 유의미한 해석을 얻진 못했다.. sad
(っ °Д °;)っ
 


결론
 
노선수와 총승객수와의 상관관계가 0.6924으로 낮지 않은 관계를 보였고
정류장당 노선수와, 정류장당 총승객수의 상관관계는 0.8827로 높은 상관관계를 보였다
1,2,3,4에 거친 EDA와 상관관계를 분석한결과 결과적으로 아래와 같은 결론을 내릴 수 있었다
 
➡️ 중구>종로구 으로 정류장을 더 지어야 함
➡️ 강동구>강서구 순으로 노선을 더 지어야 함
 


후기
 
우리 미프 2차 22조 고생한 거 우리팀이 제일 많이 잘 알고 잇다...
열심히 분석 다해놓고 마지막에 헤매는 바람에 결과물이 그저 '중구야..' 였지만 ㅋㅋㅋㅋ
 
1. 시간조절의 중요성을 느낄 수 있었고
2. 다방면으로 분석하려는 최대한의 시도를 했던
 
졌잘싸 미니프로젝트 2차였다 (´◡`