الكلمات العربية المستبعدة
الكلمات المستبعدة (stop words) هي الكلمات التي تستبعد قبل المعالجة اللغوية الآلية للبيانات (نصوص). وهي الكلمات التي تتكرر في النصوص مثل (في، من، إلى،...) ويستحسن تجاهلها وعدم فهرستها من أجل تحسين البحث. ويرجع الفضل لهانس بيتر لوهن (من الرواد في استرجاع المعلومات) في استعمال هذا المصطلح والمفهوم في التطوير.
Arabic Stop Words
Arabic stop words list المستبعدات provide a classified word list and some tools to generate all forms of stops words, Youu can reuse it and select words by categories
Download تحميل
http://sourceforge.net/projects/arabicstopwords/عرفان
- تم إنجاز هذه القائمة في لقاء ماراثون البرمجة برعاية التقنيين العرب