Dec 14

Metode Fuzzy Subtractive Clustering

Fuzzy Subtractive Clustering

Dasar dari metode Fuzzy Subtractive Clustering adalah ukuran densitas (potensi) titik-titik data dalam suatu ruang (variabel). Konsep dasar dari metode Fuzzy Subtractive Clustering adalah menentukan daerah-daerah dalam suatu variabel yang memiliki densitas tinggi terhadap titik-titik di sekitarnya. Titik dengan jumlah tetangga terbanyak akan dipilih untuk menjadi pusat kelompok. Titik yang sudah dipilih menjadi pusat kelompok ini kemudian akan dikurangi densitasnya. Selanjutnya akan dipilih titik lain yang menjadi tetangga terbanyak untuk dijadikan pusat kelompok yang lain. Hal ini akan dilakukan berulang-ulang sampai semua titik teruji. Metode fuzzy subtractive clustering tergolong metode unsupervised clustering dimana jumlah pusat cluster tidak diketahui. Metode ini menggunakan data sebagai kandidat dari pusat cluster, sehingga beban komputasi tergantung dari jumlah data dan tidak bergantung dari dimensi data. Jumlah pusat cluster yang dicari ditentukan melalui proses iterasi untuk mencari titik-titik dengan jumlah tetangga terbanyak.

Menghitung Densitas Suatu Titik

Apabila terdapat n buah data yaitu x1, x2, …, xndan dengan menganggap bahwa data-data tersebut sudah dalam keadaan normal, maka densitas suatu titik dapat dihitung dengan persamaan (Gelley, 2000) :

Dimana
Dk       = Densitas titik ke-k
xk          = titik ke-k
ra        = konstanta positif.

Dengan demikian, suatu titik data akan memiliki densitas yang besar jika titik tersebut memiliki banyak tetangga. Setelah menghitung densitas tiap-tiap titik, maka titik dengan densitas tertinggi akan terpilih menjadi pusat kelompok. Misalkan xc1 adalah titik yang terpilih menjadi pusat kelompok dan Dc1 adalah ukuran densitasnya, selanjutnya densitas dari titik-titik di sekitarnya akan dikurangi dengan persamaan (Gelley, 2000) :

Dimana rb adalah konstanta positif. Hal ini berarti bahwa titik-titik yang berada dekat dengan pusat kelompok xc1 akan mengalami pengurangan densitas secara besar-besaran. Hal ini akan berakibat titik-titik tersebut memiliki kemungkinan yang kecil untuk menjadi pusat kelompok berikutnya. Nilai rb menunjukkan suatu lingkungan yang mengakibatkan titik-titik berkurang ukuran densitasnya. Nilai rb diperoleh dari persamaan :

Biasanya squashfactor bernilai 1,5. Dengan demikian rb bernilai lebih besar dibandingkan ra.

Setelah densitas tiap-tiap titik diperbaiki, selanjutnya akan dicari pusat kelompok yang kedua, yaitu xc2. Setelah xc2 diperoleh, ukuran densitas tiap titik data akan diperbaiki kembali. Langkah-langkah ini dilakukan berulang-ulang sampai semua titik teruji. Pada implementasinya, bisa digunakan 2 bilangan sebagai faktor pembanding, yaitu accept ratio dan reject ratio. Apabila hasil bagi antara potensi tertinggi suatu titik data dengan potensi tertinggi yang pertama kali diperoleh pada iterasi pertama lebih besar daripada accept ratio, maka titik data tersebut diterima sebagai pusat kelompok baru. Apabila hasil bagi antara potensi tertinggi suatu titik data dengan potensi tertinggi yang pertama kali diperoleh pada iterasi pertama lebih kecil daripada accept ratio namun lebih besar daripada reject ratio, maka titik data tersebut baru akan diterima sebagai pusat kelompok yang baru jika titik tersebut terletak pada jarak yang cukup jauh dengan pusat kelompok yang lainnya. Namun, jika hasil bagi antara potensi tertinggi suatu titik data dengan potensi tertinggi yang pertama kali diperoleh pada iterasi pertama lebih kecil daripada accept ratio maupun reject ratio, maka titik tersebut tidak akan diperhitungkan lagi untuk menjadi pusat kelompok yang baru.

Dec 14

Metode Fuzzy C-Means Clustering

Metode Fuzzy C-Means Clustering pertama kali dikenalkan oleh Jim Bezdek pada tahun 1981 (Jain dkk, 1999). Fuzzy C-Means adalah salah satu teknik pengelompokkan data yang mana keberadaan tiap titik data dalam suatu kelompok (cluster)ditentukan oleh derajat keanggotan. Metode Fuzzy C-Means termasuk metode supervised clustering dimana jumlah pusat cluster ditentukan di dalam proses clustering. Algoritma dari fuzzy c-means adalah sebagai berikut (Yan, 1994) :

Input Data

Input data yang akan dikelompokkan, yaituX, berupa matrix berukuran n x m (n=jumlah sampel data, m=atribut setiap data). Xij data sampel ke-i (i=1,2,…n), atribut ke-j (j=1,2,..m).

Tentukan Jumlah Cluster

Tentukan jumlah cluster (c), pangkat untuk matriks partisi (w), maksimum iterasi (MaxIter), error terkecil yang diharapkan (ξ), fungsi objektif awal (Po=0), dan iterasi awal (t=1).

Bangkitkan Nilai Random

Bangkitkan bilangan random ηik, i=1,2,…n; k=1,2,…c sebagai elemen matrik partisi awal U.

Hitung Pusat Cluster ke-k

Hitung pusat cluster ke-k: , dengan k=1,2,…,c; dan j=1,2,…,m, menggunakan persamaan berikut  (Yan, 1994) :dengan :

Vkj      = pusat cluster ke-k untuk atribut ke-j
ηik      = derajat keanggotaan untuk data sampel ke-i pada cluster ke-k
xij     = data ke-i, atribut ke-j

Hitung Fungsi Objektif

Hitung fungsi objektif pada iterasi ke-t menggunakan persamaan berikut (Yan, 1994)  :
dengan:
Vkj       = pusat cluster ke-k untuk atribut ke-j
ηik       = derajat keanggotaan untuk data sampel ke-i pada cluster ke-k
xij      = data ke-i, atribut ke-j
Pt      = fungsi objektif pada iterasi ke-t

Hitung Perubahan Matriks

Hitung perubahan matriks partisi menggunakan persamaan berikut (Yan, 1994)  :

Dengan I = 1,2,…,n; dan k=1,2,…c.
Dimana :
Vkj      = pusat cluster ke-k untuk atribut ke-j
ηik      = derajat keanggotaan untuk data sampel ke-i pada cluster ke-k
xij     = data ke-i, atribut ke-j

Cek Kondisi berhenti

Jika :

ATAU

maka berhenti. Jika tidak: t=t+1, ulangi langkah ke-4.

Dec 14

Hard Clustering dan Fuzzy Clustering

Hard Clustering dan Fuzzy Clustering

Metode pengelompokan klasik (hard clustering) berdasarkan pada teori himpunan klasik, yang menentukan bahwa sebuah objek dapat menjadi anggota atau bukan anggota dari suatu cluster. Fuzzy clustering memperbolehkan suatu objek untuk menjadi anggota dari beberapa cluster sekaligus dengan derajat keanggotaan yang berbeda-beda. Derajat keanggotaan berada di antara rentang 0 dan 1. Jadi, dataset X dapat dipartisi menjadi c fuzzy subset. Di dalam situasi riil, fuzzy clustering memiliki hasil yang lebih natural dibandingkan dengan hard clustering.

Ilustrasi Hard Clustering VS Fuzzy Clustering

Ilustrasi perbedaan antara hard clustering dan fuzzy clustering ditunjukkan melalui gambar berikut ini.

Dec 14

Clustering

Clustering

Pengelompokan (clustering) merupakan teknik yang sudah cukup dikenal dan banyak digunakan untuk mengelompokkan data/objek ke dalam kelompok data (cluster) sehingga setiap cluster memiliki data yang mirip dan berbeda dengan data yang berada dalam cluster lain. Jika diberikan himpunan data yang berjumlah terhingga, yaitu X, maka permasalahan clustering dalam X adalah mencari beberapa pusat cluster yang dapat memberikan ciri kepada masing-masing cluster dalam X.

Contoh Proses Clustering

Gambar di bawah ini menunjukkan contoh sederhana dari proses clustering, dimana 3 cluster di dalam data dapat teridentifikasi dengan mudah.

Kriteria kemiripan yang digunakan dalam kasus ini adalah jarak (dalam kasus ini jarak geometris). Proses ini disebut distance-based clustering. Cara lain untuk melakukan clustering adalah conceptual clustering. Dalam conceptual clustering, objek dikelompokkan berdasarkan kecocokannya menurut konsep deskriptif.

Dec 14

Himpunan Fuzzy

Teori Himpunan Fuzzy

Teori himpunan fuzzy merupakan titik penting perkembangan konsep ketidakpastian. Teori himpunan fuzzy diperkenalkan oleh Lotfi A. Zadeh pada tahun 1965 (Klir dan Yuan, 1995). Dengan diperkenalkannya teori himpunan fuzzy, maka anggapan bahwa teori probabilitas sebagai satu-satunya alat untuk memecahkan masalah yang mengandung unsur ketidakpastian, mengalami perkembangan. Teori himpunan fuzzy merupakan salah satu alat untuk memecahkan masalah ketidakpastian. Himpunan nonfuzzy (crisp set) A didefinisikan oleh anggota-anggota himpunan tersebut. Jika a Î A, maka nilai yang berhubungan dengan a adalah 1. Namun, jika a Ï A, maka nilai yang berhubungan dengan a adalah 0. Notasi A = {x | P(x)} menunjukkan bahwa anggota A adalah x dengan P(x) benar. Jika XA merupakan fungsi karakteristik dari A, maka dapat dikatakan bahwa P(x) benar, jika dan hanya jika XA(x) = 1. Himpunan fuzzy didasarkan pada gagasan untuk memperluas jangkauan karakteristik sedemikian hingga fungsi tersebut akan mencakup bilangan riil pada interval [0,1].

Himpunan Fuzzy

Himpunan fuzzy merupakan himpunan dengan batas-batas keanggotaan yang tidak dapat ditentukan dengan dipenuhi atau tidak dipenuhinya suatu syarat keanggotaan. Keanggotaan himpunan fuzzy ditentukan oleh derajat keanggotaan yang menentukan tingkat kesesuaian setiap anggota dengan fungsi keanggotaan yang telah ditentukan dalam himpunan fuzzy. Misalkan A adalah himpunan fuzzy dan x adalah objek tertentu. Dalil “x adalah anggota A” tidak dapat dikatakan bernilai benar atau salah, seperti yang dinyatakan dalam logika dua nilai. Dalil ini dapat dikatakan bernilai benar hanya untuk derajat tertentu, yaitu derajat dimana x betul-betul anggota A. Pada umumnya, nilai kebenaran suatu dalil dinyatakan dengan bilangan riil dalam interval [0,1]. Nilai ini juga mewakili derajat keanggotaan dalam himpunan fuzzy. Notasi fungsi keanggotaan dari himpunan fuzzy A yang dilambangkan dengan μA ,  adalah sebagai berikut :

Dalam hal ini, setiap fungsi keanggotaan memetakan elemen-elemen himpunan semesta X  ke bilangan riil dalam interval [0,1] .

Dec 14

Data Mining dalam Kerangka Kerja CRM

Dimensi CRM

Menurut  Swift (2001), Parvatiyar dan Sheth (2001), serta Kracklauer, Mills, dan Seifert (2004), CRM memiliki empat dimensi, yaitu :

  1. Identifikasi konsumen (customer identification).
  2. Membangun daya tarik terhadap konsumen (customer attraction).
  3. Mempertahankan konsumen yang ada (customer retention).
  4. Pengembangkan konsumen (customer development).

Keempat dimensi dari CRM tersebut dapat dilihat sebagai siklus tertutup dalam Customer Management System. Setiap dimensi memiliki tujuan umum yang sama yaitu untuk membangun pemahaman yang lebih mendalam dari konsumen dan meningkatkan nilai konsumen (customer value) dari perusahaan. Dalam kaitannya dengan pencapaian tujuan tersebut,  teknik data mining dapat digunakan untuk menemukan karakteristik dan perilaku konsumen yang tersembunyi dalam database yang berukuran besar.

Metode Pemodelan Data

Untuk menemukan pola karakteristik dan perilaku konsumen, dapat digunakan metode pemodelan data dalam teknik data mining. Beberapa metode pemodelan data yang dapat digunakan, yaitu :

  1. Association
  2. Classification
  3. Clustering
  4. Forecasting
  5. Regression
  6. Sequence discovery
  7. Visualization

Kerangka kerja teknik data mining dalam keempat dimensi CRM dijelaskan melalui gambar berikut ini.

”"

Dec 14

Teknologi CRM

Sebuah definisi standar mengenai komponen teknologi CRM diberikan oleh META Group di dalam “The Customer Relationship Management Ecosystem”. Kategorisasi ini bertujuan untuk lebih memahami bagaimana suatu strategi CRMdan teknologinya mampu menyediakan seluruh arsitektur secara menyeluruh yang terfokus pada layanan konsumen. Adatiga tipe utama dari teknologi CRM yaitu (Tama, 2009) :

Operational CRM

Dikenal juga sebagai CRM “front office”. Operational CRM merupakan area dimana terjadi hubungan dengan konsumen secara langsung. Otomasi dari proses bisnis yang terintegrasi yang melibatkan front office customer touch points, seperti penjualan, pemasaran, dan layanan konsumen, termasuk integrasi antara front office dan back office, seperti manajemen pesanan, dan otomasi pemasaran. Dengan perkembangan teknologi informasi dan komunikasi yang pesat, operational CRM kemudian juga dapat dibedakan menjadi dua bagian yaitu e-CRM dan m-CRM.

Collaborative CRM

Merupakan bentuk perluasan dari CRM tradisional. Collaborative CRM berkaitan dengan manajemen hubungan antara stakeholder eksternal, seperti supplier, distributor, dan reseller. Aplikasi utama dari collaborative CRM adalah enterprise portal yang berbasis pada infrastruktur ekstranet dan perangkat lunak manajemen hubungan mitra (partner relationshiop management software) yang memberikan akses kepada konsumen, reseller, dan mitra bisnis melalui internet.

Analytical CRM

Dikenal sebagai CRM “back office” atau “strategic” CRM. Analytical CRM biasanya berhubungan dengan penggunaan data secara efektif, efisien dan strategis sehingga memungkinkan pengambilan keputusan yang tepat bagi pihak manajemen. Pengambilan keputusan dilaksanakan setelah melalui proses analisis, pemodelan, dan evaluasi terhadap data yang tersimpan di basis data untuk menghasilkan sebuah hubungan yang saling menguntungkan antara perusahaan dan konsumennya. Contoh dari Analytical CRM adalah business intelligence seperti data warehouse, OLAP, dan data mining.

Hal yang terpenting dalam memahami perilaku konsumen tidak hanya memahami siapa mereka (dalam hal ini customer profiling atau segmentation) tetapi juga perilaku mereka dan pola-pola (pattern) yang mereka ikuti. Pemahaman perilaku pelanggan harus ditetapkan sebagai suatu proses yang dinamis dan berkelanjutan (Xu dan Walton, 2005).