Skip to content

Commit

Permalink
Add new suffix
Browse files Browse the repository at this point in the history
  • Loading branch information
b00f committed Oct 12, 2019
1 parent accb2be commit 0695349
Show file tree
Hide file tree
Showing 5 changed files with 75 additions and 61 deletions.
4 changes: 3 additions & 1 deletion src/data/affixes
Original file line number Diff line number Diff line change
Expand Up @@ -186,7 +186,9 @@ SFX su N 2
SFX su 0 ‌تر/sdslso .
SFX su 0 ‌ترین/sgso .


## Ye With Kasre-Ezafe
SFX sv N 1
SFX sv 0 ی .

REP 9
REP ي ی
Expand Down
1 change: 1 addition & 0 deletions src/data/dic_users
Original file line number Diff line number Diff line change
@@ -1,3 +1,4 @@
ز
آئودی
آئین
آباجی
Expand Down
56 changes: 30 additions & 26 deletions src/lilak.py
Original file line number Diff line number Diff line change
Expand Up @@ -99,7 +99,7 @@ def is_kam_dandane(self, word):

dandane = 0
# http://www.persianacademy.ir/fa/pishvand.aspx
# هرگاه کلمه پردندانه (بیش­از سه دندانه) شود و یا به «ط» و «ظ» ختم شود.
# هرگاه کلمه پردندانه (بیش­ از سه دندانه) شود و یا به «ط» و «ظ» ختم شود.
# نویسه‌های «ورزژدذط ظ ک گ ا لءة» و فاصلهٔ مجازی که دندانه‌ها را جدا می‌کنند نباید قبل از آنها در محاسبه بیاید.
# مثلاً «اسباب‌بازیها» نباید دندانهٔ «اسباب‌باز» محاسبه شود
# در نتیجه کلمهٔ «اسباب‌بازیها» را هم باید قبول کند.
Expand Down Expand Up @@ -306,24 +306,24 @@ def pars_main_dic(self):
elif word.endswith(PERSIAN_WAW):
if ends_with_vowel:
label += 'sb' # عمویم، عمویت، عمویش، عمویمان، عمویتان، عمویشان
label += 'sa' # عموم، عموت، عموش، عمومان، عموتان، عموشان
label += 'sq' # عمویم، عمویی، عموست، عموییم، عمویید، عمویند
label += 'sd' # عموها
# عموهای
# عموهایی
label += 'se' # عموهایم، عموهایت، عموهایش، عموهایمان، عموهایتان، عموهایشان
label += 'sf' # عموهاست
label += 'sl' # عموی
label += 'sv' # عموی
label += 'sn' # عمویی
else:
label += 'sa' # رهروم، رهروت، رهروش، رهرومان، رهروتان، رهروشان
label += 'sr' # رهروم، رهروی، رهرویم، رهروید، رهروند
label += 'sd' # رهروها
# رهروهای
# رهروهایی
label += 'se' # رهروهایم، رهروهایت، رهروهایش، رهروهایمان، رهروهایتان، رهروهایشان
label += 'sf' # رهروهاست
label += 'sl' # رهروی
label += 'sj' # رهروان، رهروانی
label += 'sa' # آرشیوم، آرشیوت، آرشیوش، آرشیومان، آرشیوتان، آرشیوشان
label += 'sr' # آرشیوم، آرشیوی، آرشیویم، آرشیوید، آرشیوند
label += 'sd' # آرشیوها
# آرشیوهای
# آرشیوهایی
label += 'se' # آرشیوهایم، آرشیوهایت، آرشیوهایش، آرشیوهایمان، آرشیوهایتان، آرشیوهایشان
label += 'sf' # آرشیوهاست
label += 'sl' # آرشیوی

elif word.endswith(PERSIAN_YE):
label += 'sc' # کشتی‌ام، کشتی‌ات، کشتی‌اش، کشتی‌مان، کشتی‌تان، کشتی‌شان
Expand All @@ -350,7 +350,7 @@ def pars_main_dic(self):
# پاهایی
label += 'se' # پاهایم، پاهایت، پاهایش، پاهایمان، پاهایتان، پاهایشان
label += 'sf' # پاهاست
label += 'sl' # پای
label += 'sv' # پای
label += 'sn' # پایی

elif word.endswith(PERSIAN_DETACHED):
Expand Down Expand Up @@ -417,7 +417,7 @@ def pars_main_dic(self):
elif word.endswith(PERSIAN_ALEF):
label += 'sb' # هدایایم، هدایایت، هدایایش، هدایایمان، هدایایتان، هدایایشان
label += 'sq' # هدایایم، هدایایی، هدایاست، هدایاییم، هدایایید، هدایایند
label += 'sl' # هدایای
label += 'sv' # هدایای
label += 'sn' # هدایایی

elif word.endswith(PERSIAN_TA) or \
Expand Down Expand Up @@ -470,23 +470,23 @@ def pars_main_dic(self):
# شایسته‌ترها، شایسته‌ترهای
# شایسته‌ترین‌ها، شایسته‌ترین‌های
else:
label += 'sc' # کوته‌ام، کوته‌ات، کوته‌اش، کوته‌مان، کوته‌تان، کوته‌شان
label += 'sp' # کوته‌ام، کوته‌ای، کوته‌ایم، کوته‌اید، کوته‌اند
label += 'sl' # کوتهی
label += 'sg' # کوته‌ها
# کوته‌های
# کوته‌هایی
label += 'si' # کوته‌هاست
label += 'su' # کوته‌تر، کوته‌ترین
# کوته‌تری
# کوته‌ترها، کوته‌ترهای
# کوته‌ترین‌ها، کوته‌ترین‌های
label += 'sc' # کوتاه‌ام، کوتاه‌ات، کوتاه‌اش، کوتاه‌مان، کوتاه‌تان، کوتاه‌شان
label += 'sp' # کوتاه‌ام، کوتاه‌ای، کوتاه‌ایم، کوتاه‌اید، کوتاه‌اند
label += 'sl' # کوتاهی
label += 'sg' # کوتاه‌ها
# کوتاه‌های
# کوتاه‌هایی
label += 'si' # کوتاه‌هاست
label += 'su' # کوتاه‌تر، کوتاه‌ترین
# کوتاه‌تری
# کوتاه‌ترها، کوتاه‌ترهای
# کوتاه‌ترین‌ها، کوتاه‌ترین‌های

elif word.endswith(PERSIAN_WAW):
if ends_with_vowel:
label += 'sb' # پررویم، پررویت، پررویش، پررویمان، پررویتان، پررویشان
label += 'sq' # پررویم، پررویی، پرروست، پرروییم، پررویید، پررویند
label += 'sl' # پرروی
label += 'sv' # پرروی
label += 'sn' # پررویی
label += 'sd' # پرروها
# پرروهای
Expand Down Expand Up @@ -531,7 +531,7 @@ def pars_main_dic(self):
elif word.endswith(PERSIAN_ALEF):
label += 'sb' # اعلایم، اعلایت، اعلایش، اعلایمان، اعلایتان، اعلایشان
label += 'sq' # اعلایم، اعلایی، اعلاست، اعلاییم، اعلایید، اعلایند
label += 'sl' # اعلای
label += 'sv' # اعلای
label += 'sn' # اعلایی
label += 'sd' # اعلاها
# اعلاهای
Expand Down Expand Up @@ -697,6 +697,10 @@ def pars_main_dic(self):
elif pos == 'conjunction':
label += ''

### classifier ########################################################################################
elif pos == 'classifier':
label += ''

### Foreign ########################################################################################
elif pos == 'foreign':
if word.endswith(PERSIAN_HE):
Expand Down
Loading

0 comments on commit 0695349

Please sign in to comment.