Table of contents generated with markdown-toc
Mesin pencarian adalah website yang mengumpulkan dan mengorganisir konten dari seluruh bagian dari internet. Mesin pencarian merupakan cara untuk temu balik informasi.
Temu-balik informasi (information retrieval): menemukan kembali (retrieval) informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis.
Mesin pencarian ini memodelkan query
dan term
sebagai model ruang vektor. Dengan menggunakan cosine similiarity untuk perhitungannya. Kami belum akan menjelaskan secara detail disini.
Pada dasarnya website yang kami buat ini menerima query
dari pengguna dan me-ranking masukan file-file .txt
berbahasa inggris.
Pastikan sudah menginstall hal-hal berikut pada perangkat yang digunakan
- Python terinstall, jika belum dapat mendownload melalui link berikut
- Python
pip
terinstall - Flask terinstall, bisa dengan cara
pip install flask
pada terminal - Install nltk module, bisa dengan cara
pip install nltk
- Install nltk function fungsi berikut digunakan untuk stemming string
- Buka IDE python ketikkan
- import nltk
- nltk.download('punkt')
- nltk.download('stopwords')
- Buka IDE python ketikkan
- Clone repository ini pada terminal :
git clone https://github.com/mhmmdjafarg/SearchEngineApp.git
- Buka directory folder website
src
, kemudian jalankan pada terminalpython app.py
- Secara default website akan dijalankan pada
http://127.0.0.1:5000/
- Siapkan file berekstensi
.txt
yang akan dicari similiarity-nya, gunakan text berbahasa inggris 🇬🇧 - Upload file yang telah disiapkan, (file tersebut sementara akan disimpan pada directory website pada folder
src/uploads
) - Pada search bar, ketikkan query yang diinginkan, Go Search
- Untuk mencari dengan file lain, tekan tombol
reset
terlebih dahulu untuk menghapus file lama. - Enjoy 👍
📌 Bandung, Indonesia