IMPLEMENTASI ALGORITMA JARO WINKLER DISTANCE UNTUK
SISTEM PENDETEKSI SIMILARITY PADA DOKUMEN
NASKAH PUBLIKASI
NASKAH PUBLIKASI
Diajukan Oleh:
Ihsan Almunawaroh
15.11.8846
Kepada:
FAKULTAS ILMU KOMPUTER
UNIVERSITAS
AMIKOM YOGYAKARTA
YOGYAKARTA
IPLEMENTASI ALGORITMA JARO WINKLER DISTANCE UNTUK
SISTEM PENDETEKSI SIMILARITY PADA DOKUMEN
1)Informatika Universitas
AMIKOM Yogyakarta
2)Teknik Informatika Universitas AMIKOM Yogyakarta
Jl
Ringroad Utara, Condongcatur, Depok, Sleman, Yogyakarta Indonesia 55283
Email
: ihsan.al@students.amikom.ac.id1), nilafeby@amikom.ac.id2)
Similarity is looking for same word that are input
with words in the source text document or text document being tested. The
similarity in question is not a synonym, but a word that is close to or almost
the same as the word in the document being tested. The use of similarity
detection tools or can be called plagiarism detection tools in general can be a
fairly effective step in dealing with plagiarism in this globalization era.
This application uses the Jaro Winkler Distance
algorithm because this algorithm can check the similarity by only passing
through a few processes so as to minimize time and relatively faster processes,
the Jaro-winkler algorithm is very accurate and suitable for use in short
string comparisons, such as abstractions in publication texts.
Keywords : Jaro Winkler Distance, Similarity,
Artificial Intelligence.
1. Pendahuluan
1.1
Latar Belakang
Dalam dunia pendidikan,
naskah publikasi dari suatu penelitian merupakan hal yang lumrah dikerjakan
bagi kebanyakan civitas akademika. Pasalnya naskah publikasi ini menjadi syarat
untuk memperoleh gelar terutama pada strata pendidikan, magister dan doktoral.
Kemampuan dalam menyesuaikan jurnal yang sesuai dengan naskah yang telah
dikerjakan agar dapat terpublikasi di jurnal tersebut. [1] Pembahasan mengenai
penulisan naskah ini menjadi persoalan serius terkait maraknya kasus
plagiarisme yang terjadi dalam penulisan karya ilmiah ini. Hal ini disebabkan
karena kemajuan teknologi informasi membuat seorang akademisi dengan mudahnya
mendapatkan segala informasi yang dibutuhkan untuk menyelesaikan naskahnya.
Kemudahan dalam mendapatkan informasi inilah yang membuat seorang akademisi
menghasilkan karya dengan cara menyalin atau menjiplak hasil karya orang lain
sehingga terjadi banyak kesamaan data diantara akademisi.
Kasus pagiarisme
sangat bisa ditanggulangi dengan cara pencegahan dan penanganan. Sebenarnya
sudah jelas ditulis didalam Undang-Undang No. 20 tahun 2003 yang mengatur
tentang sanksi bagi orang-orang yang melakukan plagiat, khususnya yang terjadi
dalam lingkungan akademik. Penggunaan alat deteksi similarity secara umum dapat menjadi langkah yang cukup efektif
dalam menangani plagiarisme yang berfungsi untuk mendeteksi plagiarisme secara
otomatis. [2]
Berdasarkan
permasalahan tersebut dibutuhkan sistem yang dapat digunakan untuk pendeteksi similarity dokomen naskah publikasi.
Dengan menggunakan pendekatan string metrik, dimana dengan melakukan proses
perbandingan string dan memasukkan dalam fungsi matematis. Terdapat beberapa
algoritma yang berdasarkan string matric
yaitu TF/IDF, Needleman-Wunsch Distance,
Levenshtein Distance, Jaro-Winkler
Distance, dan lain sebagainya. Dari beberapa algoritma yang tersebut,
penulis memilih algoritma Jaro-Winkler
Distance karena algoritma ini dapat memeriksa kemiripan hanya dengan
melewati sedikit proses sehingga meminimalkan waktu dan proses yang relatif
lebih cepat, algoritma Jaro-winkler sangat akurat dan cocok untuk digunakan
dalam perbandingan string pendek, seperti abstraksi pada naskah publikasi. [3]
1.1
Rumusan Masalah
Berdasarkan latar belakang yang telah dijelaskan diatas dapat diambil
suatu rumusan masalah, yaitu sebagai berikut:
1.
Metode
seperti apa yang cocok untuk menguji kemiripan suatu dokumen naskah publikasi?
2.
Bagaimana
cara mengimplementasikan algoritma Jaro
Winkler Distance untuk mendeteksi similarity
pada abstraksi dokumen naskah publikasi?
3.
Bagaimana cara pengujian similarity dokumen teks dengan
menggunakan stremmer sastra?
4.
Bagaimana cara kerja aplikasi pendeteksi similarity dokumen naskah publikasi
dengan cara membandingkan dua abstraksi naskah publikasi?
1.2
Tinjauan Pustaka
Kornain A., Yansen F. (2016) membuat sebuah penelitian yang berjudul
“Penerapan Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme
Pada Dokumen Teks Berbahasa Indonesia”. Dalam penelitian tersebut, penulis
membuat sebuah penelitian untuk mendeteksi tiga tindak plagiarisme yaitu
word-for-word plagiarism, plagiarism of authorship dan plagiarism of ideas.
Kemudian penulis menghitung tingkat kemiripan data antara dua string dengan
melakukan klarifikasi berdasarkan proporsi atau persentasi kata, kalimat,
paragraf yang di bajak menjadi tiga tipe, yaitu apabila tingkat kemiripan
kurang dari 30% maka tergolong plagiarisme ringan, apabila tingkat kemiripan
30-70% maka tergolong plagiarisme sedang sedangkan tingkat kemiripan diatas 70%
maka akan tergolong plagiarisme besar atau total. [3]
Bunayari A. (2018). Penulis membuat sebuah penelitian yang berjudul
“Implementasi Algoritma Jaro Winkler
Untuk Menguji Kesamaan Teks Pada Abstraksi Tugas Akhir”. Dalam jurnal tersebut,
penulis membua sebuah sistem aplikasi yang bertujuan untuk menguji kesamaan
teks untuk mengatasi tindak plagiarisme pada abstraksi tugas akhir. Prosesi
pengujian kesamaan teks dari data awal abstraksi tugas akhir akan dilakukan
beberapa tahapan, yaitu tahap case
folding, filtering, stemming, k-grams, menghitung panjang string, dan menghitung jaro winkler. [4]
Sagala A. C. S., Lydia M. S. Dan Rahmat R. F. (2017) Mahasiswa
Universitas Sumatera Utara membuat sebuah penelitian yang berjudul “Pendeteksi
Kesamaan pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix
Stripping dan Algoritma Winnowing”. Dalam awal pendeteksian diperlukan proses
stemming untuk prefixes, infixes, suffixes, dan kombinasi awalan dan akhiran (confixes). Dalam penelitian penulis
memilih algoritma enchanced confix stripping stemmer untuk proses penguraian
teks dari imbuhannya. Untuk menghitung nilai kesamaan teks dengan dokumen dalam
database digunakan algoritma winnowing dengan teknik rolling hash. Algoritma
winnowing membuang seluruh pemakaian karakter yang tidak relevan, seperti tanda
baca, spasi, angka, dan karakter lainnya. Hanya karakter yang berupa huruf yang
akan diproses ke tahap selanjutnya. [5]
1.3
Landasan Teori
1.4.1 Kecerdasan Buatan
Kecerdasan buatan berasal dari bahasa inggris “Artificial Intelligence”
atau disingkat AI, yaitu intelligence adalah kata sifat yang berarti cerdas,
sedangkan artificial artinya buatan. Kecerdasan buatan yang dimaksud disini
merujuk pada mesin yang mampu berfikir, menimbang tindakan yang akan diambil,
dan mampu mengambil keputusan seperti yang dilakukan oleh manusia.
1.4.2 Similarity
Fungsi dari similarity salah
satunya merupakan sebagai key tape error correction atau pengoreksi kesalahan
dalam pengetikan. Perhitungan nilai similarity
dari kumpulan kata dapat ditemukan dengan menggunakan Dice’s similarity coefficient untuk pasangan
kata yang digunakan. [5] Perhitungan similarity dapat dihitung dengan menggunakan persamaan (1) di bawah
ini: (1)
1.4.3 Plagiarisme
Plagiarisme atau plagiat adalah suatu perbuatan menjiplak ide-ide,
gagasan atau karya orang lain yang kemudian diakui sebagai karya sendiri,
dimana semua yang berkaitan dengan plagiarisme merupakan sebuah pelanggaran hak
cipta. [6]
1.4.4 Text Preprocessing
Tahap ini akan melakukan analisis semantik (kebenaran arti) dan
sintaktik (kebenaran susuan) terhadap sebuah teks. Tujuannya untuk
mempersiapkan teks menjadi sebuah data yang akan diolah lebih lanjut.
1.4.5 Algoritma Jaro
Winkler Distance
Algoritma jaro winkler distance
merupakan varian dari jaro distance
metrik, yaitu sebuah algoritma untuk mengukur kesamaan antar dua string,
biasanya algoritma ini digunakan dalam pendeteksian similarity kata atau duplikat. Semakin tinggi jaro winkler distance untuk dua string, semakin mirip dengan string
tersebut. Nilai normalna yaitu 0 untuk menandakan tidak ada kesamaan, dan 1
untuk menandakan tidak adanya kesamaan, dan 1 untuk menandakan adanya kesamaan
(Kurniawati, Sulistyo dan Sazali 2010).
Dasar dari algoritma ini sendiri memiliki tiga bagian, yaitu:
1. Menghitung panjang string.
2. Menentukan jumlah karakter yang sama
didalam dua string.
3. Menentukan jumlah transposisi.
Pada algoritma jaro winkler
distance menggunakan rumus untuk menghitung jarak (dj) antara dua string
yaitu S1 dan S2 dapat dihitung dengan menggunakan persamaan (2) di
bawah ini: dj
(2)
Dimana :
m = Jumlah karakter
yang sama persis
S1 = Panjang String
1S2 = Panjang String
2
t = Jumlah transposisi
Akan tetapi bila
mengacu kepada nilai yang akan dihasilkan oleh algoritma jaro winkler diastance maka nilai maksimalnya adalah 1, yang
menandakan kesamaan string yang dibandingkan mencapai seratus persen atau sama
persis. Algoritma jaro winkler distance
menggunakan prefix scale (p), menurut Winkler nilai standar untuk konstanta ini
adalah p = 0.1 dan prefix atau panjang karakter yang sama sampai ditemukan
ketidak samaan (maksimum 4 karakter), maka untuk menghitung jaro winkler distance (dw) dapat
dihitung dengan menggunakan persamaan (3) di bawah
ini: (3)
Dimana :
dj = Jaro distance untuk string S1 dan S2
l = Panjang prefix (panjang karakter yang sama sebelum
ditemukan
ketidak samaan) nilai maksimal 4 karakter
p = Konstanta scaling factor (Nilai standar untuk
konstanta ini menurut Winkler adalah p = 0.1)
Catatan: Cara perhitungannya bisa kalian lihat di
https://www.youtube.com/watch?v=PAy9o4MhVzU&t=16s
2.
Pembahasan
2.1
Analisis Kebutuhan
2.1.1Analisis Kebutuhan Fungsional
Pada
sistem yang akan dibangun memiliki dua identifikasi fitur, yaitu sebagai
berikut:
1. Definisi Fitur.
Pendefinisian
fitur digunakan sebagai penentuan apa saja yang dilakukan aplikasi. Beberapa
fitur yang teridentifikasi dari identifikasi masalah yang telah dikemukakan di
atas dapat dilihat pada Tabel 1 di bawah ini:
Tabel 1. Tabel Definisi Fitur
Fitur
|
Keterangan
|
Mendeteksi plagiarisme
|
Aplikasi ini dapat mendeteksi
plagiarisme abstraksi naskah publikasi yang dibandingkan berdasarkan nilai
dari perhitungan similarity.
|
Menampilkan hasil deteksi plagiarisme
|
Aplikasi ini dapat menampilkan data-data
hasil dari pendeteksian similarity.
|
Melihat hasil dari deteksi similarity
|
User
dapat
melihat hasil deteksi similarity, proses-proses
pengolahan yang ditampilkan dalam bentuk tabel dan hasil persentasi similarity
yang ditampilkan pada sebuah bar proses. Dengan tiga level kriteria,
yaitu rendah, sedang dan tinggi.
|
2. Fitur Aktor
Aktor berperan
sebagai perghubungan dengan sistem, dapat berupa user atau eksternal system
yang akan menggunakan aplikasi. Untuk lebih jelasnya definisi aktor dapat
dilihat pada Tabel 2 di bawah ini:
Tabel 2. Tabel Aktor
Aktor
|
Deskripsi
|
User
|
Manusia atau orang sebagai pengguna
sistem, dan dapat mengakses fitur-fitur yang telah dijelaskan sebelumnya.
|
2.1.2Analisis Kebutuhan Non-Fungsional
Kebutuhan non-fungsional meliputi:
1.
Kebutuhan
Perangkat Lunak
Adapun
kebutuhan perangkat lunak yang digunakan untuk merancang sistem pendeteksi similarity untuk pengujian plagiarisme
ditunjukkan Tabel 3 di bawah ini:
Tabel 3. Tabel Kebutuhan Perangkat Lunak
Sistem
Operasi
|
Windows
8.1 Industry (Original)
|
Bahasa
Pemrograman
|
PHP, HTML,
CSS, Javascript
|
Teks
Editor
|
Notepad++,
Sublime
|
Web
Browser
|
Google
Chrome
|
Web
Server
|
Apache
(XAMPP Windows)
|
2.
Kebutuhan
Perangkat Keras
Kebutuhan perangkat keras yang digunakan untuk
merancang sistem pendeteksi similarity
ditunjukkan pada Tabel 4 di bawah ini:
Tabel 4.
Tabel Kebutuhan
Perangkat Keras
Processor
|
Intel
Core i3-2328M
|
Storage
|
500
GB 5400RPM SATA
|
Memory
|
6
GB DDR4
|
Screen
|
14
inch
|
VGA
|
Intel
HD 3000
|
2.2
Analisis Sistem
2.2.1 Analisis Data
Data yang dikumpulkan dan yang akan gunakan untuk dilakukan pengujian
harus memenuhi prosedur, yaitu sebagai berikut:
1. Naskah
publikasi yang diperoleh dari perpustakaan elektronik Universitas Amikom
Yogyakarta (http://repository.amikom.ac.id/)
2. Memiliki
judul yang serupa, berdasarkan jurusan yang sama atau mengandung unsur yang
sama.
3. Apabila
abstraksi tersebut berbasa Inggris maka akan diubah terlebih dahulu kedalam
bahasa Indonesia.
4. Memiliki
abstrak yang tidak cacat ketik.
5. Abstraksi
tidak melebihi 250 kata dan 2000 karakter.
2.2.2 Analisis Pemodelan Sistem
Aliran proses untuk pendeteksi similarity
abstraksi naskah publikasi menggunakan algoritma jaro winkler distance ialah sebagai
berikut:
1.
Menginputkan dua data berupa teks abstraksi naskah publikasi mahasiswa
yang diperoleh dari perpustakaan elektronik Universitas Amikom Yogyakarta
(http://repository.amikom.ac.id/)
2.
Tahap case folding, tahap ini mengubah teks kapital menjadi teks kecil,
menghilangkan tanda baca dan angka.
3.
Tahap filtering, tahap ini menghapus kata penghubung atau stopword
removal.
4.
Tahap stemming, pada tahap ini mencari kata dasar dari hasil proses
filtering.
5.
Tahap space removal, tahap ini menghapus semua spasi yang ada pada abstraksi
naskah publikasi.
6.
Tahap perhitungan jaro distance, tahap ini mencari karakter yang
sama, menghitung transposisi dan perhitungan nilai jaro distance.
7.
Tahap perhitungan jaro winkler distance, tahap ini merupakan
tahap perhitungan prefix legth, prefix scale dan proses perhitungan jaro
winkler distance.
8.
Tahap terakhir adalah menampilkan hasil similarity, yakni
menampilkan hasil perhitungan kesamaan antara dua input berupa string abstraksi
naskah publikasi yang telah diolah dari rumus jaro winkler. Dimana
perhitungan ditampilkan dalam bentuk persentase dengan tiga kategori similarity
atau level plagiarisme. Tiga level plagiarisme tersebut yaitu, rendah (0-20%),
sedang (21-60%) dan tinggi (61-100%)
3.
Rancangan Sistem
3.1
Rancangan
Perangkat Lunak
Perangkat lunak yang dibangun menerapkan algoritma jaro
winkler distance, algoritma ini merupakan algoritma untuk menghitung nilai
jarak kedekatan antara dua teks. Menurut (Winkler 1999), jaro winkler distance memiliki tiga
komponen dasar, yaitu menghitung panjang string atau kata, mencari nomor huruf
pada kedua kata, dan mencari transposisi. Semakin tinggi jarak jaro winkler
distance antara kedua teks tersebut maka akan semakin tinggi adanya similaritynya.
3.2
Perhitungan Manual
Tahap pertama merupakan proses penginputan teks abstraksi naskah
publikasi yang akan diuji yang diperoleh dari http://repository.amikom.ac.id/.
Sebagai contoh perhitungan manual penulis menggunakan dua teks dokumen yaitu ALVIAN dan ALDIAN, untuk lebih jelasnya dapat dilihat
pada Tabel di bawah ini:
Tabel 5. Tabel Dokumen
Uji
Dokumen Uji 1
|
Dokumen Uji 2
|
ALVIAN
|
ALDIAN
|
Tabel 6. Tabel Hasil
Teks Preprocessing
Dokumen Uji 1
|
Dokumen Uji 2
|
alvian
|
aldian
|
Tabel 7. Tabel Jumlah
String
Dokumen Uji 1 (S1)
|
alvian
|
6
|
Dokumen Uji 2 (S2)
|
aldian
|
6
|
Tabel 8. Tabel Karakter
yang Sama
Dokumen Uji 1 (S1)
|
alvian
|
alian
|
(m) = 5
|
Dokumen Uji 2 (S2)
|
aldian
|
Dike
4.
Pengujian
4.1
Pengujian Dalam
Sistem
Perhitungan dalam sistem mengacu dari perhitungan dengan metode
perhitungan manual yang telah dilakukan sebelumnya, dapat dilihat pada Gambar
bawah ini:
4.2
Hasil
Pengujian Naskah Publikasi
Pada
pengujian ini dilakukan dengan menggunakan lima pasang dari sepuluh naskah
publikasi yang berbeda namun memiliki kemiripan berdasarkan judul, metode dan
konsentrasi yang sama, dapat dilihat pada Tabel 9 di bawah ini:
Tabel
9. Tabel Uji Naskah Publikasi
No
|
Judul
|
Similarity
|
1
|
Pengembangan
Jaringan Wireless Dengan Wireless Hotspot Management Sistem Berbasis Captive
Portal Pada Kafe Krink'jo 24
|
70%
|
Analisis
Dan Perancangan Wireless Hotspot Management Sistem Berbasis Captive Portal
Pada Cafe Warung Stasiun
|
2
|
Perancangan
Dan Implementasi Ips (Intrusion Prevention System) Sebagai Pengamanan
Jaringan Komputer Berbasis Snort Inline
|
67%
|
Analisis
Dan Perancangan Ips (Intrusion Prevention System) Menggunakan Snort Untuk
Meningkatkan Sistem Keamanan Server Di Upt Laboratorium Universitas Amikom
Yogyakarta
|
3
|
Analisis
Dan Implementasi Intrusion Detection System (Ids) Menggunakan Snort Pada
Jaringan Wireless
|
66%
|
Perancangan
Keamanan Jaringan Berbasis Ids (Intrusion Detection System) Dan Menggunakan
Firewall Tarpit Pada Mikrotik Rb-750
|
4
|
Analisis
Dan Implementasi Perbandingan Manajemen Bandwidth Menggunakan Pcq Pada Simple
Queue Dan Queue Tree Mikrotik Rb 951ui-2hnd Pada Jaringan Layanan Indihome Pt
Ardhian Transport
|
68%
|
Analisis
Dan Perancangan Manajemen Bandwidth Dengan Metode Simple Queue Menggunakan
Mikrotik Pada Sma Negeri 1 Jetis Bantul
|
5
|
Perancangan
Jaringan Hotspot Dan Manajemen Bandwith Menggunakan Per Connection Queue
(Pcq) Di Restoran Rocket Chicken Indonesia Cabang Berbah
|
64%
|
Perancangan
Dan Implementasi Management Bandwidt Dengan Metode Pcq Pada Jaringan Hotspot
Berbasis Mikrotik Di Smk Syubbanul Wathon Magelang
|
Dari hasil pengujian naskah publikasi
dengan konsentrasi jaringan diatas, kemudian dapat dihitung nilai rata-rata
kemiripan data, yaitu sebagai berikut:
Semua tingkat similarity : 70 + 67 + 66 +
68 + 64
=
335
Totoal Naskah yang diuji : 5
Nilai rata-rata = 335/5 = 67
Jadi nilai rata-rata pengujian similarity dari 5 dokumen naskah
publikasi dengan konsentrasi jaringan adalah 67%.
5.
Penutup
5.1.
Kesimpulan
Dari pengujian
yang telah dilakukan berupa implementasi algoritma jaro winkler distance pada naskah publikasi, dapat disimpulkan
bahwa:
1. Dengan
menerapkan algoritma jaro winkler
distance kedalam aplikasi, metode ini cocok digunakan dalam penerapan
sistem pendeteksian similarity pada
dokumen naskah publikasi.
2. Cara
implementasi algortima jaro winkler
guna mendeteksi similarity ialah
dengan cara menginputkan dua abstraksi naskah publikasi yang akan diuji,
kemudian akan melalui proses text preprocessing, perhitungan jaro distance, perhitungan jaro winkler distance dan perhitungan similarity.
3. Cara
pengujian similarity dengan stremmer
sastra adalah dengan cara menginputkan kata yang memiliki root word. Dalam
bahasa Indonesia dapat menggunakan inflection suffixes, derivation suffixes dan
derivation prefix.
4. Cara
kerja algortima jaro winkler guna
mendeteksi similarity ialah dengan
cara menginputkan dua abstraksi naskah publikasi yang akan diuji, kemudian akan
melalui proses text preprocessing, perhitungan jaro distance, perhitungan jaro
winkler distance dan perhitungan similarity.
Aplikasi ini berhasil menghitung persentase kemiripan abstraksi tugas naskah
publikasi anatara teks abstraksi 1 dengan teks abstraksi 2 yang diinputkan
dengan menggunakan algoritma jaro winkler
distance.
5. Hasil
Pengujian yang telah dilakukan oleh peneliti dari konsentrasi jaringan yang
telah diuji berdasarkan naskah publikasi yang memiliki kemiripan pada judul dan
kata kuncinya ialah, konsentrasi jaringan memiliki tingkat similarity yaitu sebesar 67% similarity
rata-rata naskah publikasi yang diuji.
6. Hasil
pengujian dari konsentrasi jaringan dapat dihitung nilai rata-ratanya, cara
perhitungannya dengan menjumlah keseluruhan tingkat similarity naskah publikasi yang diuji kemudain dibagi dengan
jumlah naskah publikasi yang diuji tersebut, maka menghasilkan nilai 67%. Keseluruhan
naskah publikasi yang diuji memiliki tingkat plagiarisme tinggi, berdasarakn
tingkat level plagiarisme yang telah ditentukan.
5.2
Saran
Dalam
rancangan aplikasi ini masih terdapat banyak kekurangan yang mungkin dapat
disempurnakan lagi. Maka peneliti memberi saran diantaranya:
1. Agar
aplikasi ini dapat diterapkan dengan sempurna, maka sara dari penulis perlu
dilakukan pengembangan pada aplikasi pendeteksi plagiarisme ini.
2. Memperbarui
user interface serta menambah fitur-fitur yang dapat memperbaiki kinerja
aplikasi ini.
Daftar Pustaka
[1].
UII,
“Pentingnya Pemilihan Jurnal Dalam Publikasi,” 24 Juni, 2019. [Online].
Available: https://www.uii.ac.id/pentingnya-pemilihan-jurnal-dalam-publikasi/.
[2].
A.
Wibowo, “Mencegah dan Menanggulangi Plagiarisme di Dunia Pendidikan,” Kesmas
Natl. Public Heal. J., vol. 6, no. 5, p. 195, 2012.
[3].
P.
Novantara and O. Pasruli, “Implementasi Algoritma Jaro-Winkler Distance Untuk
Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi,” J. Buffer Inform., vol. 3,
no. 2, 2017.
[4].
A. Bunayari,
“Implementasi Algoritma Jaro-Winkler Distance
Untuk Pendeteksi Plagiarisme”.
Perpustakaan Universitas Amikom
Yogyakarta, 2018.
[5].
Sagala A. C. S., Lydia M. S. Dan Rahmat R. F. “Pendeteksian
Kesamaan pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix Stripping
dan Algoritma Winnowing,”. January, 2015.
[6].
M.
Riadi, “Pengertian, Jenis dan Identifikasi Plagiarisme,” 22 Februari, 2019.
[Online]. Available: https://www.kajianpustaka.com/2019/02/Plagiarisme.html.
Biodata Penulis
Ihsan
Almunawaroh, memperoleh gelar Sarjana Komputer (S.Kom), Jurusan
Informatika Universitas Amikom Yogyakarta, lulus tahun 2019.
Nila Feby Puspitasari, memperoleh gelar Sarjana
Komputer (S.Kom) Jurusan Teknik Informatika STMIK Amikom Yogya karta, lulus
tahun 2005. Memperoleh gelar Magister Ilmu Komputer (M.Cs) Universitas Gadjah
Mada, lulus tahun 2014.