Library untuk klasifikasi teks Bahasa Indonesia menggunakan algoritma Naive Bayes Classifier (NBC). Proses stemming pada package ini menggunakan library Sastrawi.
Install menggunakan perintah composer require biobii/naive-bayes-text-classifier
.
Menyiapkan data training. Bentuk data harus mengikuti seperti contoh berikut. Nilai pada key class
dapat disesuaikan sesuai kebutuhan.
$data = [
[
'text' => 'Filmnya bagus, saya suka',
'class' => 'positif'
],
[
'text' => 'Film jelek, aktingnya payah.',
'class' => 'negatif'
],
];
Berikut contoh lengkap penggunaan.
require __DIR__ . '/vendor/autoload.php';
use Biobii\NaiveBayes;
$data = [
[
'text' => 'Filmnya bagus, saya suka',
'class' => 'positif'
],
[
'text' => 'Filmnya menarik, aktingnya bagus',
'class' => 'positif'
],
[
'text' => 'Saya suka film ini sangat keren',
'class' => 'positif'
],
[
'text' => 'Film jelek, aktingnya payah.',
'class' => 'negatif'
],
[
'text' => 'Kecewa, ini adalah film terburuk yang pernah saya tonton',
'class' => 'negatif'
],
];
$nb = new NaiveBayes();
// mendefinisikan class target sesuai dengan yang ada pada data training.
$nb->setClass(['positif', 'negatif']);
// proses training
$nb->training($data);
// pengujian
echo $nb->predict('alur ceritanya jelek dan aktingnya payah'); // output "negatif"