수원시 스마트 버스정류장 우선 설치위치 선정 🚌
- 버스 운행정보와 도시 데이터를 활용하여, 스마트 버스정류장으로 우선 교체가 필요한 정류장 위치를 도출하는 과제입니다.
- 분석 과정에 대해 자세하게 알고 싶으시다면, 보고서 를 참고해주세요!
내부 데이터는 COMPAS 및 변수 설명 목록에서 확인할 수 있으며, 외부 데이터는 다음 사항을 참고해 주시기 바랍니다.
B3A1
├── 📂 input
│ ├── 1.수원시_버스정류장.csv
│ ├── ...
│ └── 32.수원시_지적도.geojson
│
├── 📂 data
│ ├── GGD_RouteInfo_M.xls # 경기도 버스 노선 순서
│ ├── GGD_RouteStationInfo_M.xls # 경기도 버스 노선 정보
│ ├── suwon_weather.csv # 수원시 일자별 기상 정보
│ ├── suwon_paldal.csv # 수원시 팔달구 실거래가
│ ├── suwon_ksun.csv # 수원시 권선구 실거래가
│ ├── suwon_jangan.csv # 수원시 장안구 실거래가
│ ├── suwon_yt.csv # 수원시 영통구 실거래가
│ ├── road.shp.csv # 수원시 실거래가 위경도 좌표
│ ├── house.csv # 수원시 실거래가 최종 데이터
│ ├── store_info.xlsx # 경기도 상권 데이터
│ ├── link_filter.geojson # 수원시 교통링크 필터링 데이터 (QGIS 결과물)
│ ├── dustdf.pickle # 수원시 미세먼지 데이터 (에어코리아 크롤링)
│ └── microdustdf.pickle # 수원시 초미세먼지 데이터 (에어코리아 크롤링)
│
├── 📂 busdata
│ └── bus_filter_final.geojson # 수원시 BIS&인도폭 버스정류장 필터링 데이터 (QGIS 결과물)
│
├── 📂 QGIS
│ ├── bus_filter_final.qgz # 수원시 BIS&인도폭 버스정류장 필터링
│ └── link_filter_final.qgz # 수원시 교통링크 필터링
│
├── 1_DataPreprocessing.ipynb
├── 2_SparsePCA_Clustering.ipynb
├── 3_PLS_Regression.ipynb
└── 4_Optimize_Targeting.ipynb
data, busdata 폴더 하에 데이터를 다운로드 받아주시고, 가장 상위 경로에서 ipynb 파일을 순서대로 실행해 주시기 바랍니다.
최종 결과는 /busdata/df_final.xlsx
로 저장됩니다.
- Data Preprocessing : 분석에 사용할 데이터를 전처리 하는 과정입니다.
- Sparse PCA & Clustering : SPCA를 통해 데이터를 차원축소하고, Clustering을 통해 구별 target 후보지를 선정합니다.
- PLS Regression : 변수간의 상관관계를 고려한 PLS Regression 을 적합해, 스마트 지수를 생성합니다.
- Optimize & Targeting : constraint를 부여하여 최적 스마트 버스정류장 설치위치를 찾고, 광고 타겟층을 선정합니다.