Diberdayakan oleh Blogger.
RSS

Contoh kasus Decision Tree ID3 Untuk Rekomendasi Pemberian Beasiswa di Sekolah

DECISION TREE ID3 UNTUK REKOMENDASI
PEMBERIAN BEASISWA DI SEKOLAH

SMA Negeri 2 Rembang merupakan sekolah yang menyelenggarakan program beasiswa bagi siswanya. Namun, dalam pelaksanaan program tersebut terdapat masalah-masalah yang terjadi, yaitu pihak sekolah mengalami kesulitan dalam pengambilan keputusan, dan banyaknya data pengusul menyebabkan lamanya waktu proses seleksi. Sehingga, diperlukan sebuah alat bantu/sistem untuk membantu mengatasi masalah tersebut. Tujuan penelitian ini adalah menerapkan metode decision tree ID3 dalam sistem pendukung keputusan yang dapat membantu memudahkan pengambilan keputusan beasiswa oleh pihak SMA Negeri 2 Rembang.

Decision tree
Decision tree learning merupakan salah satu metode belajar yang berusaha menemukan fungsi - fungsi pendekatan yang bernilai diskrit dan mampu menangani data - data yang terdapat kesalahan (noisy data) serta mampu mempelajari ekspresi - ekspresi disjuntive (ekspresi OR). Konsep Decision Tree yaitu mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (rule) (Wahyudin, 2009 : 2).
                                   
                                            Gambar 2.2. Konsep Decision Tree
Decision tree adalah struktur flowcart yang mempunyai tree (pohon), dimana setiap simpul internal menandakan suatu tes atribut,setiap 16 cabang merepresentasikan hasil tes, dan simpul daun merepresentasikan kelas atau distribusi kelas. Alur pada decision tree ditelusuri dari simpul ke akar ke simpul daun yang memegang prediksi kelas untuk contoh tersebut. Decision tree mudah untuk dikonversi ke aturan klasifikasi (classification rule). Dalam pohon keputusan sangat berhubungan dengan Algoritma ID3, karena dasar Algoritma ID3 adalah pohon keputusan. Algoritma data mining ID3 merupakan salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan yang bersifat
prediktif.
                                      
                                         Gambar 2.3. Contoh Decision Tree
Secara ringkas, cara kerja Algoritma ID3 dapat digambarkan sebagai berikut :
1) Ambil semua atribut yang tidak terpakai dan hitung entropinya yang berhubungan dengan test sample.
2) Pilih atribut dimana nilai entropinya minimum.
3) Buat simpul yang berisi atribut tersebut.
Untuk menghitung ID3 maka harus mencari nilai dari entropy dan information gain-nya dapat dilihat pada Rumus 1 dan Rumus 2.
                                              Entropy(S) = -pa log2 pa - pb log2 pb

                                            Gambar 2.4. Rumus Perhitungan Entropy
Keterangan:
S = data sampel yang digunakan untuk training.
pa = jumlah yang bersolusi positif (mendukung) pada data sampel untuk kriteria tertentu.
pb = jumlah yang bersolusi negatif (tidak mendukung) pada pada sampel untuk kriteria tertentu.

                                       Gain(S,A) = Entropy(S) - Σ|𝑺𝒗||𝑺|Entropy(Sv)
                                            Gambar 2.5. Rumus Perhitungan Gain
Keterangan:
A = atribut
v = Menyatakan suatu nilai yang mungkin untuk atribut
|Sv| = Jumlah sampel untuk nilai v
|S| = Jumlah seluruh sampel data
Entropy (Sv) = Entropy untuk sampel – sampel yang memiliki nilai v.

Data Mining

Langkah-langkah yang dilakukan dalam proses penambangan data (data mining) adalah:

 Pembersihan Data (Data Cleaning)
Pembersihan data dilakukan dengan memilih data siswa pengusul beasiswa yang relevan sesuai dengan krtiteria penentuan beasiswa.
 Integrasi Data (Data Integration)
Integrasi atau penggabungan data dilakukan dengan menggabungkan data – data yang penulis terima dari penyeleksi beasiswa di SMA Negeri 2 Rembang, yaitu berupa data siswa pengusul, data siswa penerima beasiswa, data daftar nilai siswa, dan data kepribadian siswa.


                  
                                            Tabel 3.2. Tabel Sebagian Data Awal Pemohon
Keterangan:
Tabel 3.3. Keterangan Data Siswa
NIS
Atribut menginformasikan Nomor IndukSiswa pemohon beasiswa.
Nama
Atribut yang difungsikan sebagai ID
Kelas
Atribut ini menginformasikan kelas siswa pemohon beasiswa.
Agama
Atribut ini menginformasikan agama yang dianut siswa pemohon
JPO
Atribut ini menginformasikan jumlahpenghasilan orangtua siswa pemohon.
JTO
Atribut ini menginformasikan jumlah tanggungan orang tua siswa pemohon.
Nilai
Atribut ini menginformasikan nilai rata-rata siswa
Kepribadian
Atribut ini menginformasikan kepribadian siswa pemohon
Beasiswa
Atribut ini menginformasikan keterangan siswa layak atau tidak untuk  mendapatkan beasiswa.
  
Seleksi Data (Data Selection)
Data yang ada pada basis data sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari basis data. Data yang digunakan yaitu
Nama, JPO, JTO, Nilai, Kepribadian, dan Beasiswa.
Tabel 3.4. Pemilihan Atribut
Atribut  
Detail Penggunaan
NIS    
X Tidak
Nama  
√ ID
Kelas  
X Tidak
Agama  
X Tidak
JPO
√ Nilai Model
JTO
√ Nilai Model
Nilai
√ Nilai Model
Kepribadian
√ Nilai Model
Beasiswa
√ Label Target
 

Tabel 3.5. Tabel Sebagian Data Siswa Setelah Pemilihan
                                                               Atribut
 
Transformasi Data (Data Transformation)
Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining decision tree ID3. Karenanya data berupa angka numerik dalam hal ini nilai siswa perlu dibagibagi menjadi beberapa interval.

Daftar Pustaka


http://lib.unnes.ac.id/25299/1/5302412073.pdf
 


  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

0 komentar:

Posting Komentar