Arabic-Stemmers is a proxy that allows access to market arabic stemmers.
pip install -r requirement.txt
requests package : https://pypi.org/project/requests/ beautifulsoup4 package: https://pypi.org/project/beautifulsoup4/
# -*- coding: utf-8 -*-
import alkhalilMorphoSysStemmer
# unicode input
string = 'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = alkhalilMorphoSysStemmer.stem(string)
Java Runtime Envionment (JRE)
# -*- coding: utf-8 -*-
from arabicStemmingToolkitAlgo1 import ArabicStemmingToolkitStemmerAlgo1 as ast_algo1_stemmer
# unicode input
string = 'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = ast_algo1_stemmer.stem(ast_algo1_stemmer, string)
# -*- coding: utf-8 -*-
from arabicStemmingToolkitAlgo2 import ArabicStemmingToolkitStemmerAlgo2 as ast_algo2_stemmer
# unicode input
string = 'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = ast_algo2_stemmer.stem(ast_algo2_stemmer, string)
# -*- coding: utf-8 -*-
from arabicStemmingToolkitAlgo3 import ArabicStemmingToolkitStemmerAlgo3 as ast_algo3_stemmer
# unicode input
string = 'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = ast_algo3_stemmer.stem(ast_algo3_stemmer, string)
# -*- coding: utf-8 -*-
import arabicProcessingCogStemmer
string = 'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = arabicProcessingCogStemmer.stem(string)
snowballStemmer : https://www.arabicstemmer.com/python
# -*- coding: utf-8 -*-
import assemsArabicLightStemmer
# unicode input
string = u'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = assemsArabicLightStemmer.stem(string)
Java Runtime Envionment (JRE)
# -*- coding: utf-8 -*-
from farasaStemmer import FarasaStemmer as farasa_stemmer
# unicode input
string = u'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = farasa_stemmer.stem(farasa_stemmer, string)
Java Runtime Envionment (JRE)
# -*- coding: utf-8 -*-
from luceneArabicAnalyzerStemmer import LuceneArabicAnalyzerStemmer as lucene_arabic_analyzer_stemmer
# unicode input
string = u'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = lucene_arabic_analyzer_stemmer.stem(lucene_arabic_analyzer_stemmer, string)
nltk package : https://pypi.org/project/nltk/
# -*- coding: utf-8 -*-
import ntlkIsriStemmer
# unicode input
string = u'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = ntlkIsriStemmer.stem(string)
requests package : https://pypi.org/project/requests/
# -*- coding: utf-8 -*-
import qutufStemmer
# unicode input
string = 'السلام عليكم'
# return an array
stems_list = qutufStemmer.stem(string)
Java Runtime Envionment (JRE)
# -*- coding: utf-8 -*-
from shereenKhojaStemmer import ShereenKhojaStemmer as shereen_khoja_stemmer
# unicode input
string = 'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = shereen_khoja_stemmer.stem(shereen_khoja_stemmer, string)
Tashaphyne package : https://pypi.org/project/Tashaphyne/
# -*- coding: utf-8 -*-
import tashaphyneStemmer
# unicode input
string = u'مكتبة لمعالجة الكلمات العربية وتجذيعها'
# return an array
stems_list = tashaphyneStemmer.stem(string)