Penerapan Metode Agglomerative Clustering Untuk Segmentasi Data Dalam Lingkungan Big Data

  • Paskal Arienda Epindonta Ginting Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan
  • Risky Immanuel Situmorang Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan
  • Muhammad Raihansyah Lubis Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan
  • Raja Ansel Hartama Sihombing Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan
  • Arnita Piliang Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan
Keywords: agglomerative clustering, big data, data segmentation, hierarchical clustering, ward linkage

Abstract

The exponential growth of data in the digital era has increased the need for analytical methods capable of handling Big Data characteristics. This study examines the application of Agglomerative Hierarchical Clustering (AHC) for data segmentation using two datasets: (1) an Iris dataset of 24 samples with 8 morphological attributes, and (2) an e-commerce transaction dataset of 10 customer records. Ward linkage was selected based on literature evidence of its superiority. Results on the Iris dataset yielded 3 optimal clusters with a Silhouette Score of 0.4196 and an Adjusted Rand Index of 0.3635, achieving 70.83% classification accuracy. In the e-commerce dataset, three customer segments were formed: premium, middle-tier, and passive customers. These findings confirm AHC as an effective multidimensional data segmentation method.

References

A. A. Nastion, P. E. P. Utomo, U. Khaira, dan A. Waladi, "Pengelompokan Provinsi Indonesia Berdasarkan Rasio Penggunaan Gas Rumah Tangga Pada Tahun 2023 Menggunakan Hierarchical Clustering," JEKIN, vol. 5, no. 1, 2025, doi: 10.58794/jekin.v5i1.1232.

N. L. A. N. Dewi et al., "Komparasi Hasil Segmentasi Metode K-Means dan Agglomerative Hierarchical terhadap Provinsi di Indonesia Berdasarkan Profil Perjalanan Wisata Tahun 2024," STATMAT, vol. 7, no. 3, hlm. 482-502, 2025.

L. Angelina et al., "Klasterisasi Indikator Kesehatan Ibu dan Anak di Indonesia Menggunakan Hierarchical Clustering Agglomerative," Universitas Muhammadiyah Semarang, 2024.

A. Sujjada, G. P. Insany, dan S. Noer, "Analisis Clustering Data Penyandang Disabilitas Menggunakan Metode Agglomerative Hierarchical Clustering dan K-means," Jurnal Teknologi dan Manajemen Informatika, vol. 10, no. 1, hlm. 1-12, 2024.

J. Novaldi dan A. W. Wijayanto, "Analisis Cluster Kualitas Pemuda di Indonesia pada Tahun 2022 dengan Agglomerative Hierarchical dan K-Means," Komputika, vol. 12, no. 2, hlm. 211-219, 2023.

A. A. R. Mulyana et al., "Penerapan Algoritma K-Means Clustering dan Hierarchical Clustering dalam Mengelompokkan Data Pengangguran di Karawang," Algoritma, vol. 21, no. 2, 2024.

F. Rahmawati dan S. E. Fallo, "Hierarchical Agglomerative Clustering dengan Metode Ward untuk Pemetaan Pasar Tenaga Kerja Pascapandemi di Jawa Tengah," Leibniz: Jurnal Matematika, vol. 5, no. 1, hlm. 65-77, 2025.

A. P. Wijaya et al., "Pengelompokkan Kabupaten/Kota di Pulau Jawa Berdasarkan Faktor Kemiskinan Menggunakan Metode Hierarchical Clustering," Evolusi, vol. 13, no. 1, 2025.

C. T. N. Handayani dan M. N. N. Sitokdana, "Comparison of K-Means++ and Agglomerative Hierarchical Methods in Clustering Healthcare Workers," INOVTEK Polbeng - Seri Informatika, vol. 10, no. 2, 2025.

V. Nellie, V. C. Mawardi, dan N. J. Perdana, "Implementasi Metode Agglomerative Hierarchical Clustering untuk Sistem Rekomendasi Film," Jurnal Ilmu Komputer dan Sistem Informasi, Universitas Tarumanagara, 2022.

W. Usna dan R. Aprilia, "Comparison of Agglomerative Hierarchical Clustering (AHC) Algorithm and K-Means Algorithm in Poverty Data Clustering in North Sumatra," Desimal: Jurnal Matematika, vol. 7, no. 3, hlm. 489-500, 2024.

S. Wulandari, "Clustering Indonesian Provinces on Prevalence of Stunting Toddlers Using Agglomerative Hierarchical Clustering," Faktor Exacta, vol. 16, no. 2, hlm. 161-169, 2023.

A. F. Dewi dan K. Ahadiyah, "Agglomerative Hierarchy Clustering Pada Penentuan Kelompok Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Pendidikan," Zeta - Math Journal, vol. 7, no. 2, hlm. 57-63, 2022.

S. D. Raihannabil et al., "Perbandingan Agglomerative Nesting dan K-Means untuk Klasterisasi Ketimpangan Gender berdasarkan Dimensi Kesehatan Reproduksi," Politeknik Statistika STIS, 2023.

G. G. Ghiffary et al., "Perbandingan Algoritma HDBSCAN dan Agglomerative Hierarchical Clustering dalam Klasterisasi pada Data yang Mengandung Pencilan," JRAM, vol. 8, no. 2, hlm. 122-135, 2024.

R. Kusumastuti et al., "Clustering Titik Panas Menggunakan Algoritma Agglomerative Hierarchical Clustering (AHC)," Cogito Smart Journal, vol. 8, no. 2, 2022.

S. Tuhpatussania, S. Erniwati, dan Z. Mutaqin, "Perbandingan Metode Agglomerative Hierarchical Clustering dan Metode KMedoids dalam Pengelompokan Data Titik Panas Kebakaran Hutan di Indonesia," Journal Computer and Technology, vol. 2, no. 1, hlm. 31-38, 2024.

T. Abdulpatah, B. N. Sari, dan Susilawati, "Perbandingan Algoritma K-Means dan Agglomerative Hierarchical Clustering untuk Pengelompokan Daerah Penghasil Padi di Indonesia," JITET, vol. 13, no. 3, 2025.

R. F. Sinaga, M. A. Prabukusumo, dan J. Manurung, "Comparison of K-Means Clustering with Hierarchical Agglomerative Clustering for the Analysis of Food Security of Rice Sector in Indonesia," IDSS, vol. 8, no. 1, hlm. 22-33, 2025.

B. Hartono, V. Lusiana, dan I. H. Al Amin, "Perbandingan Proses Klasterisasi Data Menggunakan K-Means Clustering dan Agglomerative Hierarchical Clustering," JURIKOM, vol. 12, no. 4, hlm. 628-635, 2025.

Published
2026-04-15
How to Cite
Ginting, P. A., Situmorang, R., Lubis, M., Sihombing, R. A., & Piliang, A. (2026). Penerapan Metode Agglomerative Clustering Untuk Segmentasi Data Dalam Lingkungan Big Data. Jurnal Sistem Informasi Dan Informatika, 4(1), 70-78. https://doi.org/10.47233/jiska.v4i1.2639
Section
Articles