Evaluasi Model Machine Learning untuk Prediksi Harga Mobil dengan Perbandingan Ensemble dan Regresi Linear
DOI:
https://doi.org/10.70340/jirsi.v4i1.181Kata Kunci:
prediksi, machine learning, gradient boosting, random forest, regresi linearAbstrak
Prediksi harga mobil merupakan tantangan utama dalam industri otomotif karena dipengaruhi oleh berbagai faktor, seperti spesifikasi teknis, jenis bahan bakar, dan sistem transmisi. Penelitian ini bertujuan untuk mengevaluasi dan membandingkan kinerja model regresi linear serta metode ensemble learning, yaitu Random Forest dan Gradient Boosting, dalam memprediksi harga mobil. Dataset yang digunakan berasal dari Kaggle dengan 11.914 baris data dan 16 fitur. Proses penelitian meliputi tahap data understanding, data preparation, pemodelan, dan evaluasi menggunakan metrik Mean Squared Error (MSE) dan R-squared (R²). Hasil penelitian menunjukkan bahwa model Gradient Boosting memiliki performa terbaik dengan nilai R² sebesar 0.963868 dan MSE terendah dibandingkan model lainnya, diikuti oleh Random Forest dengan R² sebesar 0.899657. Sebaliknya, regresi linear menunjukkan performa yang lebih rendah dengan R² sebesar 0.417905, menunjukkan keterbatasannya dalam menangani hubungan non-linear dalam data. Hasil prediksi dengan model terbaik menunjukkan estimasi harga yang cukup mendekati harga aktual, meskipun masih beberapa perlu perbaikan melalui optimasi hyperparameter .Penelitian ini menegaskan bahwa metode ensemble learning, khususnya Gradient Boosting, merupakan pendekatan yang lebih efektif dalam memprediksi harga mobil dibandingkan regresi linear. Model ini berpotensi diterapkan dalam industri otomotif untuk meningkatkan akurasi estimasi harga kendaraan bagi produsen, dealer, maupun konsumen.
Unduhan
Referensi
V. Viswanatha, A. C. Ramachandra, B. D. Parameshachari, H. V. Vachan, and S. S. Shetty, “Predicting the Price of used Cars using Machine Learning,” 2023 Int. Conf. Evol. Algorithms Soft Comput. Tech. EASCT 2023, pp. 1–6, 2023, doi: 10.1109/EASCT59475.2023.10393486.
F. A. Alghifari, R. Andreswari, and E. Sutoyo, “Used Cars Price Prediction In Dki Jakarta Using Extreme Gradient Boosting And Bayesian Optimization Algorithm,” Proc. - Int. Conf. Adv. Data Sci. E-Learning Inf. Syst. ICADEIS 2022, pp. 1–5, 2022, doi: 10.1109/ICADEIS56544.2022.10037301.
A. F. Kinadi, R. Andreswari, E. Sutoyo, R. Nugraha, and A. A. B. Kamil, “Used Car Price Prediction in Surabaya Using Random Forest Regressor Algorithms,” Proc. - Int. Conf. Adv. Data Sci. E-Learning Inf. Syst. ICADEIS 2022, pp. 1–4, 2022, doi: 10.1109/ICADEIS56544.2022.10037526.
M. Ahmad et al., “Car Price Prediction using Machine Learning,” 2024 IEEE 9th Int. Conf. Converg. Technol. I2CT 2024, pp. 3–7, 2024, doi: 10.1109/I2CT61223.2024.10544124.
C. Jin, “Price Prediction of Used Cars Using Machine Learning,” Proc. 2021 IEEE Int. Conf. Emerg. Sci. Inf. Technol. ICESIT 2021, pp. 223–230, 2021, doi: 10.1109/ICESIT53460.2021.9696839.
M. Hankar, M. Birjali, and A. Beni-Hssane, “Used Car Price Prediction using Machine Learning: A Case Study,” 11th Int. Symp. Signal, Image, Video Commun. ISIVC 2022 - Conf. Proc., pp. 1–4, 2022, doi: 10.1109/ISIVC54825.2022.9800719.
Y. Li, Y. Li, and Y. Liu, “Research on Used Car Price Prediction Based on Random Forest and LightGBM,” 2022 IEEE 2nd Int. Conf. Data Sci. Comput. Appl. ICDSCA 2022, pp. 539–543, 2022, doi: 10.1109/ICDSCA56264.2022.9988116.
N. O. Idris, A. Achban, S. A. Utiarahman, J. Karim, and F. Pontoiyo, “Predicting the selling price of cars using business intelligence with the feed-forward backpropagation algorithms,” 2020 5th Int. Conf. Informatics Comput. ICIC 2020, 2020, doi: 10.1109/ICIC50835.2020.9288594.
S. Shaprapawad, P. Borugadda, and N. Koshika, “Car Price Prediction:An Application of Machine Learning,” 6th Int. Conf. Inven. Comput. Technol. ICICT 2023 - Proc., no. Icict, pp. 242–248, 2023, doi: 10.1109/ICICT57646.2023.10134142.
L. P. Nasyuli, I. Lubis, and A. M. Elhanafi, “Penerapan Model Machine Learning Algoritma Gradient Boosting dan Linear Regression Melakukan Prediksi Harga Kendaraan Bekas,” J. Ilmu Komput. dan Sist. Informasi(JIRSI), vol. 2, no. 2, pp. 299–310, 2023, doi: 10.70340/jirsi.v2i2.56.
P. H. Putra, A. Azanuddin, B. Purba, and Y. A. Dalimunthe, “Random Forest and Decision Tree Algorithms for Car Price Prediction,” J. Mat. Dan Ilmu Pengetah. Alam LLDikti Wil. 1, vol. 4, no. 1, pp. 81–89, 2023, doi: 10.54076/jumpa.v3i2.305.
D. Miftahul Huda, G. Dwilestari, A. Rizki Rinaldi, and Lin, “Prediksi Harga Mobil Bekas Menggunakan Algoritma Regresi Linear Berganda,” J. Inform. dan Rekayasa Perangkat Lunak, vol. 6, no. 1, pp. 150–157, 2024, doi: 10.36499/jinrpl.v6i1.10266.
A. Testas, “Multiple Linear Regression with Pandas, Scikit-Learn, and PySpark,” in Distributed Machine Learning with PySpark: Migrating Effortlessly from Pandas and Scikit-Learn, Berkeley, CA: Apress, 2023, pp. 53–74. doi: 10.1007/978-1-4842-9751-3_3.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Nur Oktavin Idris, Fuad Pontoiyo

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.