Skip to content

Latest commit

 

History

History
47 lines (32 loc) · 2.77 KB

File metadata and controls

47 lines (32 loc) · 2.77 KB

Machine Learning Model for used Car Auction Prices

⭐ Member
Ridho (as Mentor)
Bayu Purnama (as Project Leader)
Benedikta Imelda
Fernando
Gerrit Ezra Yudi Kairupan
Hafizha Aghnia Hasya
Radhimas Januar Rachman
Triogi Bintari
Yasmin Fauziah

🔰Introduction

Final project Data Science Bootcamp Batch 36 di Rakamin Academy. Dalam project ini sebagai Data Scientist dataset yang digunakan adalah Used Car Auction Prices (https://www.kaggle.com/datasets/tunguz/used-car-auction-prices). Dataset ini berisikan data historis mobil bekas yang terjual pada lelang di Amerika Serikat sekitar tahun 2014 - 2015.

Rumusan Masalah

  • Perusahaan Ingin meningkatkan profit dan penjualan mobil, karena kondisi saat ini belum optimal.
  • Profit belum optimal dikarenakan proses appraisal mobil belum efisien biaya dan waktu, juga harga belum objektif bagi penjual dan pembeli yang berdampak pada keuntungan perusahaan.

Goals

  • Meningkatkan profit penjualan mobil dengan efisiensi cost dan harga yang menguntungkan

Objectives

  • Membuat model yang dapat memprediksi harga mobil bekas secara otomatis dan merekomendasikan harga yang menguntungkan berdasarkan spesifikasi dan kondisi unit
  • Diharapkan model ini dapat membuat proses appraisal lebih efisien, berujung pada peningkatan sales dan kepuasan pelanggan.

📌Business Metrics

  • Jumlah mobil yang berhasil diappraisal dalam satu hari
  • Profit Penjualan dari hasil rekomendasi harga

👣Stages

Project ini dibagi menjadi 4 Stages:

  • Stage 1 - Data Preparation: Mempelajari dataset dan proses bisnis yang telah dipilih. Poin-poin utama dalam tahap ini adalah sebagai siapa kita dalam proyek ini, penentuan rumusan masalah, tujuan, dan objektif yang ingin dicapai, serta menentukan business metrics.
  • Stage 2 - EDA (Exploratory Data Analysis): Menelusuri dataset untuk memahami karakteristik dari data tersebut. Proses ini dibagi menjadi 3 langkah, dimulai dari Descriptive Statistics, EDA, dan mengumpulkan wawasan terkait dataset dengan visualisasi.
  • Stage 3 - Pre-Processing: Proses menangani data agar menjadi data bersih sebelum memulai proses modelling. Proses cleaning ini mencakup handling missing value, data duplikat, pencilan/nilai ekstrim (outliers), dan feature engineering.
  • Stage 4 - Machine Learning Modelling (Supervised Learning): Proses pemodelan dan eksperimen dengan menerapkan dan mengevaluasi algoritma yang cocok. Kemudian melakukan feature selection, hyperparameter tuning, dan feature selection.