Classification of Water Quality Using K-Nearest Neighbors, Naïve Bayes, and Logistic Regression

  • Mandy Sandra Denny Teknik Informatika, Fakultas Teknologi Informasi, Universitas Tarumanagara
  • Dyah Erny Herwindiati Teknik Informatika, Fakultas Teknologi Informasi, Universitas Tarumanagara
Keywords: KNN, Water Quality, Logistic Regression, Machine Learning, Naïve Bayes

Abstract

Water is a natural resource that is very important for the life of living creatures on earth, but water is very easily contaminated with bacteria and dangerous substances. Therefore, it is important to pay attention to the quality of water on earth. To classify water quality as safe or unsafe, there are many methods that can be used. To choose the most suitable method, four methods were used, namely K-Nearest Neighbors (KNN), Naïve Bayes, and Logistic Regression. In this research, the dataset used is Water Quality from the Kaggle website which contains 7999 samples with 20 features and 1 target class. The aim of this research is to compare methods to obtain the highest accuracy values, accuracy results obtained from implementing algorithms in machine learning. The results obtained from the KNN, Naïve Bayes, and Logistic Regression methods were 89.62%, 78.69%, and 89.81% respectively. The highest accuracy result is Logistic Regression, so this method is the best method for classifying water quality data.

Downloads

Download data is not yet available.

References

Rahman, M. A., Hidayat, N., & Supianto, A. A. 2018. Komparasi Metode Data Mining K-Nearest Neighbor Dengan Na{"i}ve Bayes Untuk Klasifikasi Kualitas Air Bersih (Studi Kasus PDAM Tirta Kencana Kabupaten Jombang). Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer. 2(12): 6346-6353.

Rahman, F. Y., Purnomo, I. I. and Hijriana, N. 2018. Penerapan Algoritma Data Mining Untuk Klasifikasi Kualitas Air. Technologia: Jurnal Ilmiah. 13(3): 228-232.

Aini, Q. 2018. Analisa Zat Organik Bod dan Cod Pada Air Sungai disekitar Pabrik Tahu di Daerah Junok Bangkalan. Thesis. Universitas Muhammadiyah Surabaya.

Faiza, I. M., & Andriani, W. 2022. Tinjauan Pustaka Sistematis: Penerapan Metode Machine Learning untuk Deteksi Bencana Banjir. Jurnal Minfo Polgan. 11(2): 59-63.

Roihan, A., Sunarya, P. A., & Rafika, A. S. 2020. Pemanfaatan Machine Learning dalam Berbagai Bidang. Jurnal Khatulistiwa Informatika. 5(1): 490845.

Hartanti, D. & Pradana, A. I. 2023. Komparasi Metode Decission Tree, Logistic Regression, SVM, dan ANN Dalam Klasifikasi Kualitas Air. SMARTICS Journal. 9(1): 1-6.

Tangkelayuk, A. 2022. The Klasifikasi Kualitas Air Menggunakan Metode KNN, Na{"i}ve Bayes, dan Decision Tree. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi). 9(2): 1109-1119.

MsSmartyPants. 2021. Water Quality. Available: https://www.kaggle.com/datasets/mssmartypants/water-quality.

Pritalia, G. L. 2022. Analisis Komparatif Algoritme Machine Learning dan Penanganan Imbalanced Data pada Klasifikasi Kualitas Air Layak Minum. KONSTELASI: Konvergensi Teknologi dan Sistem Informasi. 2(1).

Setyadji, A. E. S., & Wibowo, A. P. 2021. Analisis Klaster Data Pasien Diabetes untuk Identifikasi Pola dan Karakteristik Pasien. Jurnal Teknologi Dan Sistem Informasi Bisnis. 5(3): 172-182.

Diponegoro, M. H., Kusumawardani, S. S., & Hidayah, I. 2021. Tinjauan pustaka sistematis: implementasi metode deep learning pada prediksi kinerja murid. Jurnal Nasional Teknik Elektro Dan Teknologi Informasi. 10(2): 131-138.

Aziz, A., Zy, A. T., & Sunge, A. S. 2024. Prediksi Penjualan Obat Dan Alat Kesehatan Terlaris Menggunakan Algoritma K-Nearest Neighbor. Jurnal Teknologi Dan Sistem Informasi Bisnis. 6(1): 117-124.

Devita, R. N., Herwanto, H. W., & Wibawa, A. P. (2018). Perbandingan kinerja metode naive bayes dan k-nearest neighbor untuk klasifikasi artikel berbahasa indonesia. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 5(4): 427-434.

Baharuddin, M. M., Azis, H., & Hasanuddin, T.. 2019 Analisis Performa Metode K-Nearest Neighbor untuk Identifikasi Jenis Kaca. ILKOM Jurnal Ilmiah. 11(3): 269-274.

Arinda, P. H., & Angga, L. 2024. Sistem Prediksi Penjualan Produk APD Terlaris di PT A3 Karunia Sidoarjo menggunakan Metode Naive Bayes. Jurnal Teknologi Dan Sistem Informasi Bisnis. 6(2): 431-437.

Sari, Y. S. 2021. Penerapan Metode Na{"i}ve Bayes Untuk Mengetahui Kualitas Air Di Jakarta. Jurnal Ilmiah FIFO. 13(2): 222-228.

Muharemi, F., Logof{u{a}}tu, D., & Leon, F. 2019. Machine learning approaches for anomaly detection of water quality on a real-world data set. Journal of Information and Telecommunication. 3(3): 294-307.

F. D. Pramakrisna, F. D. Adhinata and N. A. F. Tanjung. 2022. Aplikasi Klasifikasi SMS Berbasis Web Menggunakan Algoritma Logistic Regression. Teknika. 11(2): 90-97.

A. S. Dharma, O. Y. Silitonga and H. J. Manurung. 2019. PERBANDINGAN ALGORITMA Naïve BAYES, ID3, DAN TAN PADA KLASIFIKASI SMS SPAM. Journal of Maritime and Education (JME). 1(2).

M. I. Fikri, T. S. Sabrila and Y. Azhar. 2020. Perbandingan metode na{"i}ve bayes dan support vector machine pada analisis sentimen twitter. SMATIKA Jurnal: STIKI Informatika Jurnal. 10(02): 71-76.

K. Nugroho and S. Murdowo. 2022. Klasifikasi Jenis Hewan Pada Kebun Binatang Dengan Menggunakan Metode Deep Neural Network. Jurnal Ilmiah Infokam. 18(1): 46-51

Published
2024-11-03
How to Cite
Denny, M., & Herwindiati, D. E. (2024). Classification of Water Quality Using K-Nearest Neighbors, Naïve Bayes, and Logistic Regression. Jurnal Teknologi Dan Sistem Informasi Bisnis, 6(4), 851-858. https://doi.org/10.47233/jteksis.v6i4.1649
Section
Articles