DECISION TREE ID3 UNTUK REKOMENDASI
PEMBERIAN BEASISWA DI SEKOLAH
SMA Negeri 2
Rembang merupakan sekolah yang menyelenggarakan program beasiswa bagi siswanya.
Namun, dalam pelaksanaan program tersebut terdapat masalah-masalah yang
terjadi, yaitu pihak sekolah mengalami kesulitan dalam pengambilan keputusan,
dan banyaknya data pengusul menyebabkan lamanya waktu proses seleksi. Sehingga,
diperlukan sebuah alat bantu/sistem untuk membantu mengatasi masalah tersebut.
Tujuan penelitian ini adalah menerapkan metode decision tree ID3 dalam
sistem pendukung keputusan yang dapat membantu memudahkan pengambilan keputusan
beasiswa oleh pihak SMA Negeri 2 Rembang.
Decision tree
Decision tree
learning merupakan
salah satu metode belajar yang berusaha menemukan fungsi - fungsi pendekatan
yang bernilai diskrit dan mampu menangani data - data yang terdapat kesalahan (noisy
data) serta mampu mempelajari ekspresi - ekspresi disjuntive (ekspresi
OR). Konsep Decision Tree yaitu mengubah data menjadi pohon keputusan (decision
tree) dan aturan-aturan keputusan (rule) (Wahyudin, 2009 : 2).
Gambar
2.2. Konsep Decision Tree
Decision tree adalah struktur flowcart
yang mempunyai tree (pohon), dimana setiap simpul internal
menandakan suatu tes atribut,setiap 16 cabang merepresentasikan hasil tes, dan
simpul daun merepresentasikan kelas atau distribusi kelas. Alur pada decision
tree ditelusuri dari simpul ke akar ke simpul daun yang memegang prediksi
kelas untuk contoh tersebut. Decision tree mudah untuk dikonversi ke
aturan klasifikasi (classification rule). Dalam pohon keputusan sangat
berhubungan dengan Algoritma ID3, karena dasar Algoritma ID3 adalah pohon
keputusan. Algoritma data mining ID3 merupakan salah satu algoritma yang
digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan yang
bersifat
prediktif.
Gambar
2.3. Contoh Decision Tree
Secara ringkas,
cara kerja Algoritma ID3 dapat digambarkan sebagai berikut :
1) Ambil semua atribut
yang tidak terpakai dan hitung entropinya yang berhubungan dengan test
sample.
2) Pilih atribut
dimana nilai entropinya minimum.
3) Buat simpul
yang berisi atribut tersebut.
Untuk menghitung
ID3 maka harus mencari nilai dari entropy dan information gain-nya dapat
dilihat pada Rumus 1 dan Rumus 2.
Entropy(S) = -pa log2 pa - pb log2 pb
Gambar
2.4. Rumus Perhitungan Entropy
Keterangan:
S = data sampel
yang digunakan untuk training.
pa = jumlah yang
bersolusi positif (mendukung) pada data sampel untuk kriteria tertentu.
pb = jumlah yang
bersolusi negatif (tidak mendukung) pada pada sampel untuk kriteria tertentu.
Gain(S,A) = Entropy(S) - Σ|𝑺𝒗||𝑺|Entropy(Sv)
Gambar 2.5. Rumus Perhitungan Gain
Keterangan:
A = atribut
v = Menyatakan suatu nilai yang
mungkin untuk atribut
|Sv| = Jumlah sampel untuk
nilai v
|S| =
Jumlah seluruh sampel data
Entropy (Sv) = Entropy untuk
sampel – sampel yang memiliki nilai v.
Data
Mining
Langkah-langkah yang dilakukan
dalam proses penambangan data (data mining) adalah:
Pembersihan
Data (Data Cleaning)
Pembersihan data dilakukan dengan
memilih data siswa pengusul beasiswa yang relevan sesuai dengan krtiteria penentuan
beasiswa.
Integrasi Data (Data Integration)
Integrasi atau penggabungan data
dilakukan dengan menggabungkan data – data yang penulis terima dari penyeleksi
beasiswa di SMA Negeri 2 Rembang, yaitu berupa data siswa pengusul, data siswa
penerima beasiswa, data daftar nilai siswa, dan data kepribadian siswa.
Tabel
3.2. Tabel Sebagian Data Awal Pemohon
Keterangan:
Tabel 3.3. Keterangan Data Siswa
NIS
|
Atribut
menginformasikan Nomor IndukSiswa pemohon beasiswa.
|
Nama
|
Atribut yang
difungsikan sebagai ID
|
Kelas
|
Atribut ini
menginformasikan kelas siswa pemohon beasiswa.
|
Agama
|
Atribut ini
menginformasikan agama yang dianut siswa pemohon
|
JPO
|
Atribut ini
menginformasikan jumlahpenghasilan orangtua siswa pemohon.
|
JTO
|
Atribut ini
menginformasikan jumlah tanggungan orang tua siswa pemohon.
|
Nilai
|
Atribut ini
menginformasikan nilai rata-rata siswa
|
Kepribadian
|
Atribut ini
menginformasikan kepribadian siswa pemohon
|
Beasiswa
|
Atribut ini
menginformasikan keterangan siswa layak atau tidak untuk mendapatkan beasiswa.
|
Seleksi
Data (Data Selection)
Data yang ada pada basis data
sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai
untuk dianalisis yang akan diambil dari basis data. Data yang digunakan yaitu
Nama, JPO, JTO, Nilai,
Kepribadian, dan Beasiswa.
Tabel 3.4. Pemilihan Atribut
Atribut
|
Detail
Penggunaan
|
NIS
|
X Tidak
|
Nama
|
√ ID
|
Kelas
|
X Tidak
|
Agama
|
X Tidak
|
JPO
|
√ Nilai Model
|
JTO
|
√ Nilai Model
|
Nilai
|
√ Nilai Model
|
Kepribadian
|
√ Nilai Model
|
Beasiswa
|
√ Label Target
|
Tabel 3.5. Tabel Sebagian Data
Siswa Setelah Pemilihan
Atribut
Transformasi
Data (Data Transformation)
Data diubah atau digabung ke
dalam format yang sesuai untuk diproses dalam data mining decision tree ID3.
Karenanya data berupa angka numerik dalam hal ini nilai siswa perlu dibagibagi menjadi
beberapa interval.
Daftar Pustaka
http://lib.unnes.ac.id/25299/1/5302412073.pdf






0 komentar:
Posting Komentar