! Morphological Transducer for Yiddish Multichar_Symbols ! Part of speech categories % ! Noun % ! Verb % ! Auxiliary % ! Determiner % ! Pronoun % ! Preposition % ! Determiner % ! Adverb % ! Adjective % ! Preadverb % ! Coordinating conjunction % ! Subordinating conjunction % ! Conjunctive adverb % ! Proper noun % ! title % ! Numeral ! types of pronouns, determiners, and adjectives % ! personal % ! personal possessive % ! reflexive % ! attributive ("prepositive") % ! predicative ("postpositive", nominalised) % ! interrogative % ! Comparative % ! Superlative % ! Quantifier ! number: for nouns, verbs, adjectives, determiners, etc. % ! Plural % ! Singular ! definiteness % ! Definite % ! Indefinite ! gender: for nouns, determiners, adjectives, etc. % ! masculine % ! feminine % ! neuter % ! masculine/feminine/neuter ! person % ! 1st person % ! 2nd person % ! 3rd person % ! impersonal ! cases: for determiners, pronouns, etc. % ! nominative % ! accusative % ! dative ! verb forms % ! infinitive % ! present % ! past participle % ! present participle % ! imperative ! Proper noun types % ! topographic (places) % ! anthroponyms (given names) % ! cognomens (family names) % ! organisations ! Punctuation % ! Percent % ! Sentence marker % ! Hyphen % ! Comma % ! Apostrophe % ! Quote marker (right hand side) % ! Quote marker (left hand side) % ! Parenthetical marker (right hand side) % ! Parenthetical marker (left hand side) % ! Letter ! Misc % ! Ordinal ! Escaped characters %> ! morpheme boundary %. %, № %- % %+ %− %{ь%} ! used for umlaut of ~previous vowel for verbs %{ь2%} ! used for umlaut of ~previous vowel for adjectives %{ױ%} ! for ױ to ײ umlaut correspondence %{ע%} ! ע or empty; in -{ע}ן is empty except after נ and ל %{ס%} ! ס in סט superlative, deletes after other ס %{ן%} ! ן sometimes ם ! matched features %[%+pp%] ! past participle %[%-pp%] ! past participle %[%+→on%] %[%-→on%] %[%+←on%] %[%-←on%] %[√on%] ! Regular umlaut correspondences: ! ו - י ! אָ - ע ! ױ - ײ/ײַ ! אַ - ע אַ אָ ײַ יִ וּ בּ בֿ כּ כֿ פֿ פּ תּ יי וו וי ייִ !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!! M O R P H O T A C T I C S !!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! LEXICON Root NounRoot ; DetRoot ; VerbRoot ; Conjunctions ; Prepositions ; Pronouns ; Punctuation ; Adverbs ; Adjectives ; ProperNouns ; Titles ; Numerals ; Digits ; ! Use/Circ !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !==============================================================================! ! ! N U M E R A L S ! ! WARNING: This section should not be modified without consultation. ! Test cases are not yet in dev/numerals. !==============================================================================! LEXICON SQRD ! This lexicon includes common ways of writing squared, cubed etc. ²%:2 # ; ! Dir/LR ³%:3 # ; ! Dir/LR ²%:² # ; ³%:³ # ; %: # ; LEXICON NUM-DIGIT %: # ; ! FIXME: find some way to make these generate! %%:%>סט ADJ-INFL-ENDINGS ; ! Dir/LR %%:%>ט ADJ-INFL-ENDINGS ; ! Dir/LR %%:%% # ; °С%:°С # ; °С%:ºС # ; ! Dir/LR °С%:С # ; ! Dir/LR °%:° # ; ! Dir/LR ! Measurement units ק%"מ:ק%"מ SQRD ; ! "kilometres" ! FIXME: add more LEXICON LASTDIGIT 1:1 NUM-DIGIT ; ! 2:2 NUM-DIGIT ; ! 3:3 NUM-DIGIT ; ! 4:4 NUM-DIGIT ; ! 5:5 NUM-DIGIT ; ! 6:6 NUM-DIGIT ; ! 7:7 NUM-DIGIT ; ! 8:8 NUM-DIGIT ; ! 9:9 NUM-DIGIT ; ! LEXICON LASTDIGIT-REST 1%0:1%0 NUM-DIGIT ; ! 2%0:2%0 NUM-DIGIT ; ! 3%0:3%0 NUM-DIGIT ; ! 4%0:4%0 NUM-DIGIT ; ! 5%0:5%0 NUM-DIGIT ; ! 6%0:6%0 NUM-DIGIT ; ! 7%0:7%0 NUM-DIGIT ; ! 8%0:8%0 NUM-DIGIT ; ! 9%0:9%0 NUM-DIGIT ; ! LEXICON POWERS %0%0:%0%0 NUM-DIGIT ; ! %0%0%0:%0%0%0 ִNUM-DIGIT ; ! LEXICON LOOP %,:%, DIGITLEX ; %.:%. DIGITLEX ; %,:%, LASTDIGIT ; %.:%. LASTDIGIT ; %,:%, LASTDIGIT-REST ; %.:%. LASTDIGIT-REST ; %,:%, POWERS ; %.:%. POWERS ; DIGITLEX ; LASTDIGIT ; LASTDIGIT-REST ; POWERS ; LEXICON DIGITLEX %0:%0 LOOP ; 1:1 LOOP ; 2:2 LOOP ; 3:3 LOOP ; 4:4 LOOP ; 5:5 LOOP ; 6:6 LOOP ; 7:7 LOOP ; 8:8 LOOP ; 9:9 LOOP ; !==============================================================================! ! N U M E R A L L E X I C O N E N D S H E R E !==============================================================================! !!! Format for noun lexica is N-[gender]-[class] !!! gender: M, F, N !!! class: UML, UML-ER, S, N, NULL, HEB LEXICON N-M-UML %%%: # ; %%%:%{ь%} # ; LEXICON N-F-UML %%%: # ; %%%:%{ь%} # ; LEXICON N-M-UML-ER %%%: # ; %%%:%>%{ь%}ער # ; LEXICON N-F-UML-ER %%%: # ; %%%:%>%{ь%}ער # ; LEXICON N-N-UML-ER %%%: # ; %%%:%>%{ь%}ער # ; LEXICON N-M-S %%%: # ; %%%:%>ס # ; LEXICON N-F-S %%%: # ; %%%:%>ס # ; LEXICON N-N-S %%%: # ; %%%:%>ס # ; LEXICON N-M-N %%%: # ; %%%:%>%{ע%}ן # ; LEXICON N-F-N %%%: # ; %%%:%{ע%}ן # ; LEXICON N-N-N %%%: # ; %%%:%{ע%}ן # ; LEXICON N-M-NULL %%%: # ; %%%: # ; LEXICON N-F-NULL %%%: # ; %%%: # ; LEXICON N-N-NULL %%%: # ; %%%: # ; LEXICON N-M-HEB %%%: # ; %%%:ים # ; LEXICON N-M-HEB-N %%%: # ; %%%:נים # ; LEXICON N-M-NOPL %%%: # ; LEXICON N-F-NOPL %%%: # ; LEXICON N-F-HEB %%%:ה # ; %%%:ות # ; LEXICON N-M-REBE %%%%: # ; %%%%:ן # ; %%%%:ן # ; %%%:ס # ; %%%:ים # ; ! (Hebrew plural) Dir/LR LEXICON DET-DEF-M %%%%:ער # ; %%%%:עם # ; %%%%:עם # ; LEXICON DET-DEF-F %%%%:י # ; %%%%:י # ; %%%%:ער # ; LEXICON DET-DEF-N %%%%:אָס # ; %%%%:אָס # ; %%%%:עם # ; LEXICON DET-DEF-PL %%%%:י # ; %%%%:י # ; %%%%:י # ; LEXICON DET-INDEF %%%: # ; ! FIXME: deal with alternate אַן LEXICON V-FINAL-PARTICLE # ; ! non-particle verbs %[%+→on%]:%#% אָן # ; LEXICON V-INITIAL-PARTICLE # ; ! non-particle verbs %[%+←on%]: # ; LEXICON V-COMMON %%%%: V-FINAL-PARTICLE ; %%%%:%>סט V-FINAL-PARTICLE ; %%%%:%>ט V-FINAL-PARTICLE ; %%%%:%>%{ע%}ן V-FINAL-PARTICLE ; %%%%:%>ט V-FINAL-PARTICLE ; %%%%:%>%{ע%}ן V-FINAL-PARTICLE ; %: V-COMMON-INF ; %: V-COMMON-IMP ; %: V-COMMON-PPRS ; LEXICON V-COMMON-INF %:%>%{ע%}ן V-INITIAL-PARTICLE ; LEXICON V-COMMON-PPRS %:%>%{ע%}נדיק V-INITIAL-PARTICLE ; LEXICON V-COMMON-IMP V-COMMON-IMP-SG ; V-COMMON-IMP-PL ; LEXICON V-COMMON-IMP-SG %%: V-FINAL-PARTICLE ; LEXICON V-COMMON-IMP-PL %%:%>ט V-FINAL-PARTICLE ; LEXICON V-REG ! Plain old weak verbs V-COMMON ; %%%[%+pp%]:%>ט V-INITIAL-PARTICLE ; LEXICON V-REG-NOPREF ! Weak verbs that take no prefix V-COMMON ; %%:%>ט V-INITIAL-PARTICLE ; LEXICON V-STRONG-NOPP V-COMMON ; LEXICON V-STRONG-PP-ONLY %%%[%+pp%]:%>%{ע%}ן V-INITIAL-PARTICLE ; LEXICON V-STRONG-7 ! class 7 strong verbs V-COMMON ; %%%[%+pp%]:%>%{ע%}ן # ; LEXICON V-GEYN-GEY %: V-COMMON-INF ; %%%%: V-FINAL-PARTICLE ; %%%%:%>סט V-FINAL-PARTICLE ; %%%%:%>ט V-FINAL-PARTICLE ; %%%%:%>ט V-FINAL-PARTICLE ; %: V-COMMON-IMP ; LEXICON V-GEYN-GEYE %%%%:%>%{ע%}ן V-FINAL-PARTICLE ; %%%%:%>%{ע%}ן V-FINAL-PARTICLE ; %: V-COMMON-PPRS ; LEXICON V-TON-TU %%%%: V-FINAL-PARTICLE ; %%%%:%>סט V-FINAL-PARTICLE ; %%%%:%>ט V-FINAL-PARTICLE ; %%%%:%>%{ע%}ן V-FINAL-PARTICLE ; %%%%:%>ט V-FINAL-PARTICLE ; %%%%:%>%{ע%}ן V-FINAL-PARTICLE ; %: V-COMMON-IMP ; %: V-COMMON-PPRS ; LEXICON V-TON-TO %: V-COMMON-INF ; %%%[%+pp%]:%>%{ע%}ן V-INITIAL-PARTICLE ; LEXICON V-ZAYN-ZE %%%%:%>נען # ; %%%%:%>נען # ; LEXICON V-ZAYN-ZAY %%%%:%>נען # ; %%%%:%>ט # ; %%%%:%>נען # ; %: V-COMMON-INF ; %: V-COMMON-IMP ; %: V-COMMON-PPRS ; LEXICON V-ZAYN-BI %%%%:%>ן # ; %%%%:%>סט # ; LEXICON V-ZAYN-IZ %%%%: # ; LEXICON V-ZAYN-VE %%%[%+pp%]:ן # ; %%%[%+pp%]:זן # ; ! Dir/LR LEXICON V-HOBN-HOB %: V-COMMON-INF ; %: V-COMMON-PPRS ; %: V-COMMON-IMP-SG ; %%%%: # ; %%%%:%>ן # ; %%%%:%>ן # ; LEXICON V-HOBN-HO %%%%:%>סט # ; %%%%:%>ט # ; %%%%:%>ט # ; %: V-COMMON-IMP-PL ; LEXICON V-HOBN-HA %%%[%+pp%]:ט # ; LEXICON VAux-COMMON-DEL %%%:%>סט # ; %%%:%>ט # ; %%%:%>ט # ; LEXICON VAux-COMMON-NODEL %%%: # ; %%%:%>ן # ; %%%:%>ן # ; LEXICON VAux-HOBN-HOB %: V-COMMON-INF ; %: VAux-COMMON-NODEL ; LEXICON VAux-HOBN-HO %: VAux-COMMON-DEL ; LEXICON VAux-HOBN-HA %%%[%+pp%]:ט # ; LEXICON VAux-VEL-VEL %: VAux-COMMON-NODEL ; LEXICON VAux-VEL-VE %: VAux-COMMON-DEL ; LEXICON VAux-REG-INFL %%%: # ; %%%:%>סט # ; %%%: # ; %%%:%>ן # ; %%%:%>ט # ; %%%:%>ן # ; %%[%+pp%]:ט # ; LEXICON VAux-REG %: V-COMMON-INF ; %: VAux-REG-INFL ; LEXICON CC %: # ; LEXICON PREP-EN PREP ; %%+דער%%%:%>%{ע%}%{ן%} # ; %%+דער%%%:%>%{ע%}%{ן%} # ; %%+דאָס%%%:%>%{ע%}%{ן%} # ; LEXICON PREP %: # ; LEXICON PRON-IND %%: # ; LEXICON PRON-P1-SG איך%%%%%:איך # ; איך%%%%%:מיך # ; איך%%%%%:מיר # ; LEXICON PRON-P2-SG דו%%%%%:דו # ; דו%%%%%:דיך # ; דו%%%%%:דיר # ; LEXICON PRON-P3-SG ער%%%%%%:ער # ; ער%%%%%%:אים # ; ער%%%%%%:אים # ; זי%%%%%%:זי # ; זי%%%%%%:זי # ; זי%%%%%%:איר # ; עס%%%%%%:עס # ; עס%%%%%%:עס # ; עס%%%%%%:אים # ; LEXICON PRON-P1-PL מיר%%%%%:מיר # ; מיר%%%%%:אונדז # ; מיר%%%%%:אונדז # ; LEXICON PRON-P2-PL איר%%%%%:איר # ; איר%%%%%:אײַך # ; איר%%%%%:אײַך # ; LEXICON PRON-P3-PL זײ%%%%%:זײ # ; זײ%%%%%:זײ # ; זײ%%%%%:זײ # ; LEXICON ADJ-COMMON %: # ; %: ADJ-INFL-ENDINGS ; LEXICON ADJ-INFL-ENDINGS %%%:%>ער # ; %%%:%>%{ע%}%{ן%} # ; %%%:%>%{ע%}%{ן%} # ; %%%:%>ע # ; %%%:%>ע # ; %%%:%>ער # ; %%%%:%>ע # ; %%%%:%>ע # ; %%%%:%>%{ע%}%{ן%} # ; %%%%: # ; %%%%: # ; %%%%: # ; ! FIXME: figure out how to deal with "postpositive/nominalised" neuter forms, ! e.g. at https://en.wiktionary.org/wiki/%D7%92%D7%A8%D7%95%D7%99%D7%A1 ! or https://en.wiktionary.org/wiki/%D7%A9%D7%98%D7%90%D6%B7%D7%A8%D7%A7 ! and how they're different from predicative forms %%%:%>ע # ; %%%:%>ע # ; %%%:%>ע # ; LEXICON ADJ-UML %%:%>%{ь2%}ער ADJ-COMMON ; %%:%>%{ь2%}%{ס%}ט ADJ-COMMON ; %: ADJ-COMMON ; LEXICON ADJ %%:%>ער ADJ-COMMON ; %%:%>%{ס%}ט ADJ-COMMON ; %: ADJ-COMMON ; LEXICON ADJ-BARE %: # ; LEXICON ADJ-NO-COMP %: ADJ-COMMON ; LEXICON ADJ-IRREG-COMP %%:%>ער ADJ-COMMON ; %%:%>%{ס%}ט ADJ-COMMON ; LEXICON DET-PERS-AGREEMENT %%%%: # ; %%%%: # ; %%%%: # ; %%%%: # ; %%%%: # ; %%%%: # ; %%%%: # ; %%%%: # ; %%%%: # ; %%%%:%>ע # ; %%%%:%>ע # ; %%%%:%>ע # ; %%%%:%>ער # ; %%%%:%>%{ע%}%{ן%} # ; %%%%:%>%{ע%}%{ן%} # ; %%%%:%>ע # ; %%%%:%>ע # ; %%%%:%>ער # ; %%%%:%>ס # ; %%%%:%>ס # ; %%%%:%>%{ע%}%{ן%} # ; %%%%:%>ע # ; %%%%:%>ע # ; %%%%:%>ע # ; LEXICON DET-PERS-P1SG %%: DET-PERS-AGREEMENT ; LEXICON DET-PERS-P2SG %%: DET-PERS-AGREEMENT ; LEXICON DET-PERS-P3SGMN %%: DET-PERS-AGREEMENT ; LEXICON DET-PERS-P3SGF %%: DET-PERS-AGREEMENT ; LEXICON DET-PERS-P1PL %%: DET-PERS-AGREEMENT ; LEXICON DET-PERS-P2PL %%: DET-PERS-AGREEMENT ; LEXICON DET-PERS-P3PL %%: DET-PERS-AGREEMENT ; LEXICON DET-ITG %%: ADJ-INFL-ENDINGS ; LEXICON DET-QNT %%: # ; LEXICON PRON-ITG %%: # ; LEXICON ADV-ITG %%: # ; LEXICON ADV %: # ; LEXICON CNJSUB %: # ; LEXICON CNJADV %: # ; LEXICON PREADV %: # ; LEXICON NP-TOP %%: # ; LEXICON NP-ANT-M %%%: # ; LEXICON NP-ANT-F %%%: # ; LEXICON NUM %: # ; LEXICON NUM-ORD %%: # ; LEXICON NUM-ORD-ADJ %%: # ; %%: ADJ-INFL-ENDINGS ; !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!! L E X I C O N !!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! LEXICON Conjunctions אָבער:אָבער CC ; ! "but" אָדער:אָדער CC ; ! "or" און:און CC ; ! "and" סײַ:סײַ CC ; ! "both/and" אַז:אַז CNJSUB ; ! "that" אַלס:אַלס CNJSUB ; ! "when" אַפֿילו:אַפֿילו CNJSUB ; ! "even though; despite" אױב:אױב CNJSUB ; ! "if" װי:װי CNJSUB ; ! "how" װען:װען CNJSUB ; ! "when" װײַל:װײַל CNJSUB ; ! "because" LEXICON Adverbs װוּ:װאו ADV-ITG ; ! "where" ! Dir/LR װוּ:װוּ ADV-ITG ; ! "where" װוּהין:װאוהין ADV-ITG ; ! "whither" װוּהין:װוּהין ADV-ITG ; ! "whither" װי:װי ADV-ITG ; ! "how" װען:װען ADV-ITG ; ! "when" װי:װי PREADV ; ! "how" אַזױ:אַזױ ADV ; ! "thus" אַרױס:אַרױס ADV ; ! "out" אַרײַן:אַרײַן ADV ; ! "in, inside" אױך:אױך ADV ; ! "also" אױס:אױס ADV ; ! "over (finished)" דאָרט:דאָרט ADV ; ! "there" הײַנט:הײַנט ADV ; ! "today" מער:מער ADV ; ! "more" נאָך:נאָך ADV ; ! "still" נאָך:נאָך PREADV ; ! "still" ! FIXME: CHECK נאָר:נאָר PREADV ; ! "only" נישט:ניט ADV ; ! "not" ! Dir/LR נישט:נישט ADV ; ! "not" פֿאַראַן:פֿאַראַן ADV ; ! "there" צוזאַמען:צוזאַמען ADV ; ! "together" צוריק:צוריק ADV ; ! "back" שױן:שױן ADV ; ! "already, yet" LEXICON Prepositions אַלס:אַלס PREP ; ! "as" אַרום:אַרום PREP ; ! "around" אָן:אָן PREP ; ! "without" אום:אום PREP ; ! "around; over" אונטער:אונטער PREP ; ! "under" איבער:איבער PREP ; ! "over, above; about" אין:אין PREP-EN ; ! "in" אױף:אױף PREP-EN ; ! "on, by" ביז:ביז PREP ; ! "up to, until" בײַ:בײַ PREP-EN ; ! "у" דורך:דורך PREP ; ! "through" זינט:זינט PREP ; ! "since" זינט:זײַט PREP ; ! "since" זינט:צײַט PREP ; ! "since" כּדי:כּדי PREP ; ! "in order (to)" לעבן:לעבן PREP ; ! "next to" לעבן:נעבן PREP ; ! "next to" לױט:לױט PREP ; ! "according to" מיט:מיט PREP-EN ; ! "with" נאָך:נאָך PREP-EN ; ! "after" פֿאַר:פֿאַר PREP-EN ; ! "for, per" פֿון:פֿון PREP-EN ; ! "of, from" צו:צו PREP-EN ; ! "to" צוליב:צוליב PREP ; ! "because of" צװישן:צװישן PREP ; ! "between" קעגן:קעגן PREP ; ! "against" קײן:קײן PREP ; ! "to (+place)" װי:װי PREP ; ! "like" װעגן:װעגן PREP ; ! "about" LEXICON DetRoot דער:ד DET-DEF-M ; ! "the" די:ד DET-DEF-F ; ! "the" דאָס:ד DET-DEF-N ; ! "the" די:ד DET-DEF-PL ; ! "the" אַ:אַ DET-INDEF ; ! "a" אַ:אַן DET-INDEF ; ! "an" ! Dir/LR קײן:קײן DET-INDEF ; ! "a/an, no, any" מײַן:מײַן DET-PERS-P1SG ; דײַן:דײַן DET-PERS-P2SG ; זײַן:זײַן DET-PERS-P3SGMN ; איר:איר DET-PERS-P3SGF ; אונדזער:אונדזער DET-PERS-P1PL ; אײַער:אײַער DET-PERS-P2PL ; זײער:זײער DET-PERS-P3PL ; װעלך:װעלך DET-ITG ; ! "which" אַלע:אַלע DET-QNT ; ! "all" אַ% סך:אַ% סך DET-QNT ; ! "a lot" אַ% סך:אַסאַך DET-QNT ; ! "a lot" עטלעכע:עטלעכע DET-QNT ; ! "some (a few)" LEXICON Pronouns PRON-P1-SG ; PRON-P2-SG ; PRON-P3-SG ; PRON-P1-PL ; PRON-P2-PL ; PRON-P3-PL ; מען%%%%:מען # ; מען%%%%:מע # ; ! Dir/LR װאָס%%%:װאָס # ; װאָס%%%:װאָס # ; װאָס%%%:װאָס # ; זיך%%:זיך # ; װעלך:װעלך PRON-ITG ; ! "which one (?)" FIXME: CHECK גאָרנישט:גאָרנישט PRON-IND ; ! "nothing" גאָרנישט:גאָרניט PRON-IND ; ! Dir/LR אַלץ:אַלץ PRON-IND ; ! "everything" עפּעס:עפּעס PRON-IND ; ! "something" LEXICON NounRoot אַפּריל:אַפּריל N-M-N ; ! "April" אַרבעט:אַרבעט N-F-S ; ! "work" אָקטאָבער:אָקטאָבער N-M-S ; ! "October" אױגוסט:אױגוסט N-M-N ; ! "August" CHECK: PL in N? אײַזנבאַן:אײַזנבאַן N-F-N ; ! "railroad" בּאַן:בּאַן N-F-N ; ! "train, railroad" בּאַרג:בּאַרג N-M-UML ; ! "mountain" בּױם:בּ%{ױ%}ם N-M-UML-ER ; ! "tree" plural with ײ באַפֿעלקערונג:באַפֿעלקערונג N-F-N ; ! "population" בוך:בוך N-N-UML-ER ; ! "book" געלט:געלט N-N-UML-ER ; ! "money" NOTE: no umlaut [possible] געשיכטע:געשיכטע N-F-S ; ! "history" דעצעמבער:דעצעמבער N-M-S ; ! "December" דעצעמבער:דעצעמבער N-M-S ; ! "December" דרום:דרום N-M-NOPL ; ! "south" הימל:הימל N-M-N ; ! "heaven" היסטאָריע:היסטאָריע N-F-S ; ! "history" הױז:הױז N-N-UML-ER ; ! "house" plural with ײַ זון:זון N-F-N ; ! "sun" זון:זון N-M-UML ; ! "son" חסיד:חסיד N-M-HEB ; ! "khosid (Hassid)" חתונה:חתונ N-F-HEB ; ! "wedding" טאָג:טאָג N-M-UML ; ! "day" טאָכטער:טאָכטער N-F-UML ; ! "daughter" טײל:טײל N-F-N ; ! "part" יאַנואַר:יאַנואַר N-M-N ; ! "January" יאָר:יאָר N-M-N ; ! "year" יולי:יולי N-M-S ; ! "July" יוני:יוני N-M-S ; ! "June" ייִד:איד N-M-N ; ! "Jew" ! Dir/LR ייִד:ייִד N-M-N ; ! "Jew" ישיבה:ישיב N-F-HEB ; ! "yeshiva" לאַן:לאַן N-M-N ; ! "meadow" לאַנד:לאַנד N-N-UML-ER ; ! "country, land" לעבן:לעבן N-N-S ; ! "life" מאַרץ:מאַרץ N-M-N ; ! "March" מזרח:מזרח N-M-NOPL ; ! "east" מיטן:מיטן N-M-S ; ! "middle" מלחמה:מלחמ N-F-HEB ; ! "war" מענטש:מענטש N-M-N ; ! "human; mentsh, gentleman" מערבֿ:מערבֿ N-M-NOPL ; ! "west" מײַ:מײַ N-N-N ; ! "May" CHECK: PL in N? נאָמען:נאָמען N-M-UML ; ! "name" ! FIXME: irreg alternative plural נעמענער נאָװעמבער:נאָװעמבער N-M-S ; ! "November" סטאַנציע:סטאַנציע N-F-S ; ! "station" סעפּטעמבער:סעפּטעמבער N-M-S ; ! "September" CHECK: PL in S? ספֿר:ספֿר N-M-HEB ; ! "seyfer (religious book)" פּאָיעזד:פּאָיעזד N-M-N ; ! "train" פֿאָטער:פֿאָטער N-M-S ; ! "father" פֿעברואַר:פֿעברואַר N-M-N ; ! "February" CHECK: PL in N? פֿרײַנד:פֿרײַנד N-M-NULL ; ! "friend" צוג:צוג N-M-N ; ! "train" צפֿון:צפֿון N-M-NOPL ; ! "north" צײַט:צײַט N-F-N ; ! "time" קאַלענדאָר:קאַלענדאַר N-M-N ; ! "calendar" קינד:קינד N-N-UML-ER ; ! "child" (technically no umlaut) קריג:קריג N-F-N ; ! "war" רבֿ:רבֿ N-M-HEB-N ; ! "rov (rabbi)" (pl: rabonem) רבי:רבי N-M-REBE ; ! "rebe (rabbi)" רעגירונג:רעגירונג N-F-N ; ! "government" שטאַט:שטאַט N-M-N ; ! "state" שטאָט:שטאָט N-F-UML ; ! "city" שװעסטער:שװעסטער N-F-NULL ; ! "sister" תּורה:תּורה N-F-NOPL ; ! "Torah (Hebrew bible)" װאַסער:װאַסער N-N-N ; ! "water" װעג:װעג N-M-N ; ! "way" װעלט:װעלט N-F-N ; ! "world" !FIXME: how to deal with words like the following (compounds, plural on first word) !בית החיים ! "cemetery" !בית הקברות ! "cemetery" !בית עולם ! "cemetery" !בית עלמין ! "cemetery" LEXICON VerbRoot %[%-pp%]:גע VerbStems ; ! past participle VerbStems ; ! other forms %[%-←on%]%[%-pp%]:אָנגע VerbStems ; ! past participle %[%-→on%]: VerbStems ; ! other forms %[%-←on%]:אָנ VerbStems ; ! other forms LEXICON IrregularVerbs אָנטאָן%[√on%]:טאָ V-TON-TO ; ! "put on clothes" אָנטאָן%[√on%]:טו V-TON-TU ; ! "put on clothes" טאָן:טאָ V-TON-TO ; ! "do" טאָן:טו V-TON-TU ; ! "do" זײַן:זײַ V-ZAYN-ZAY ; זײַן:בי V-ZAYN-BI ; זײַן:איז V-ZAYN-IZ ; זײַן:װע V-ZAYN-VE ; זײַן:זע V-ZAYN-ZE ; ! Dir/LR האָבן:האָב V-HOBN-HOB ; האָבן:האָ V-HOBN-HO ; האָבן:האַ V-HOBN-HA ; גײן:גאַנג V-STRONG-PP-ONLY ; ! "go" גײן:גײ V-GEYN-GEY ; ! "go" גײן:גײע V-GEYN-GEYE ; ! "go" LEXICON Auxiliaries האָבן:האָב VAux-HOBN-HOB ; ! "have" האָבן:האָ VAux-HOBN-HO ; האָבן:האַ VAux-HOBN-HA ; װעל:װעל VAux-VEL-VEL ; ! "will" װעל:װע VAux-VEL-VE ; דאַרפֿן:דאַרף VAux-REG ; ! "have to, ought to, must" זאָלן:זאָל VAux-REG ; ! "should" קענען:קענ VAux-REG ; ! "can" LEXICON VerbStems IrregularVerbs ; Auxiliaries ; אַרבעטן:אַרבעט V-REG ; ! "work" אָנהײבן%[√on%]:הױב V-STRONG-PP-ONLY ; ! "begin" אָנהײבן%[√on%]:הײב V-STRONG-NOPP ; ! "begin" בּעטן:בּעט V-STRONG-7 ; ! "ask" באַקומען:באַקום V-REG-NOPREF ; ! "receive, acquire" בלײַבן:בליב V-STRONG-PP-ONLY ; ! "stay" בלײַבן:בלײַב V-STRONG-NOPP ; ! "stay" געפֿינען:געפֿין V-STRONG-NOPP ; ! "find" געפֿינען:פֿון V-STRONG-PP-ONLY ; ! "find" דאַרפֿן:דאַרף V-REG ; ! "need, require" הײסן:הײס V-STRONG-7 ; ! "be called" זאָגן:זאָג V-REG ; ! "say" לעבן:לעב V-REG ; ! "live" מאַכן:מאַך V-REG ; ! "make" נעמען:נום V-STRONG-PP-ONLY ; ! "took" נעמען:נעם V-STRONG-NOPP ; ! "take" עסן:געס V-STRONG-PP-ONLY ; ! "eat" עסן:עס V-STRONG-NOPP ; ! "eat" פֿאַרלירן:פֿאַרליר V-REG-NOPREF ; ! "lose" פֿאָרן:פֿאָר V-STRONG-7 ; ! "ride, drive, travel by animal/vehicle" קומען:קום V-STRONG-7 ; ! "come" קענען:קענ V-REG ; ! "know" קױפֿן:קױפֿ V-REG ; ! "buy" רעדן:רעד V-REG ; ! "speak" שרײַבן:שריב V-STRONG-PP-ONLY ; ! "write" שרײַבן:שרײַב V-STRONG-NOPP ; ! "write" װערן:װאָר V-STRONG-PP-ONLY ; ! "become" װערן:װער V-STRONG-NOPP ; ! "become" LEXICON Adjectives אַלט:אַלט ADJ-UML ; ! "old" אַנדער:אַנדער ADJ-NO-COMP ; ! "different" גוט:בעס ADJ-IRREG-COMP ; ! "better/best" גוט:גוט ADJ-NO-COMP ; ! "good" געבױרן:געבױרן ADJ-BARE ; ! "born" גרױס:גרױס ADJ-UML ; ! "big" היסטאָריש:היסטאָריש ADJ-NO-COMP ; ! "historical" FIXME: CHECK NO-COMP? הױפּט:הױפּט ADJ-NO-COMP ; ! "head, main" יונג:יונג ADJ-UML ; ! "young" פּאָפּולער:פּאָפּולער ADJ ; ! "popular" שטאַרק:שטאַרק ADJ ; ! "strong" שלעכט:ערג ADJ-IRREG-COMP ; ! "worse/worst" שלעכט:שלעכט ADJ-NO-COMP ; ! "bad" שײן:שײן ADJ-UML ; ! "beautiful" בּאַקאַנט:בּאַקאַנט ADJ-NO-COMP ; ! "well known" FIXME: CHECK NO-COMP? LEXICON ProperNouns אַמעריקע:אַמעריקע NP-TOP ; ! "America" אײראָפּע:אײראָפּע NP-TOP ; ! "Europe" דײַטשלאַנד:דײַטשלאַנד NP-TOP ; ! "Germany" ירושלים:ירושלים NP-TOP ; ! "Jerusalem" ישראל:ישראל NP-TOP ; ! "Israel" ארץ% ישראל:ארץ% ישראל NP-TOP ; ! "Land of Israel" ! FIXME: Maybe just N? לאָס% אַנדזשעלעס:לאָס% אַנדזשעלעס NP-TOP ; ! "Los Angeles" ניו% יאָרק:ניו% יאָרק NP-TOP ; ! "New York" ניו% יאָרק:ניו%-יאָרק NP-TOP ; ! "New York" ! Dir/LR ניו% יאָרק:ניו%־יאָרק NP-TOP ; ! "New York" ! Dir/LR ענגלאַנד:ענגלאַנד NP-TOP ; ! "England" קאַנאַדע:קאַנאַדע NP-TOP ; ! "Canada" רוסלאַנד:רוסלאַנד NP-TOP ; ! "Russia" אַבֿרהם:אַבֿרהם NP-ANT-M ; ! "Avrohem" אהרן:אהרן NP-ANT-M ; ! "Arn" דוד:דוד NP-ANT-M ; ! "Dovid" יוסף:יוסף NP-ANT-M ; ! "Yo(y)sef" יעקבֿ:יעקבֿ NP-ANT-M ; ! "Yankev" יצחק:יצחק NP-ANT-M ; ! "Yitskhok" ישראל:ישראל NP-ANT-M ; ! "Yisroel" מאיר:מאיר NP-ANT-M ; ! "Meyer" מנחם:מנחם NP-ANT-M ; ! "Menakhem" מענדל:מענדל NP-ANT-M ; ! "Mendl" משה:משה NP-ANT-M ; ! "Moyshe" נחמן:נחמן NP-ANT-M ; ! "Nakhman" LEXICON Numerals אײנס:אײנס NUM ; ! FIXME: counting 1 אײן:אײן NUM ; ! FIXME: number one; also TODO: inflected forms of אײן צװײ:צװײ NUM ; ! "two" דרײַ:דרײַ NUM ; ! "three" פֿיר:פֿיר NUM ; ! "four" פֿינף:פֿינף NUM ; ! "five" זעקס:זעקס NUM ; ! "six" זיבן:זיבן NUM ; ! "seven" אַכט:אַכט NUM ; ! "eight" נײַן:נײַן NUM ; ! "nine" צען:צען NUM ; ! "ten" עלף:עלף NUM ; ! "eleven" צװעלף:צװעלף NUM ; ! "twelve" דרײַצן:דרײַצן NUM ; ! "thirteen" פֿערצן:פֿערצן NUM ; ! "fourteen" פֿופֿצן:פֿופֿצן NUM ; ! "fifteen" זעכצן:זעכצן NUM ; ! "sixteen" זיבעצן:זיבעצן NUM ; ! "seventeen" אַכצן:אַכצן NUM ; ! "eighteen" נײַנצן:נײַנצן NUM ; ! "nineteen" צװאַנציק:צװאַנציק NUM ; ! "twenty" דרײַסיק:דרײַסיק NUM ; ! "thirty" פֿערציק:פֿערציק NUM ; ! "forty" פֿופֿציק:פֿופֿציק NUM ; ! "fifty" זעכציק:זעכציק NUM ; ! "sixty" זיבעציק:זיבעציק NUM ; ! "seventy" אַכציק:אַכציק NUM ; ! "eighty" נײַנציק:נײַנציק NUM ; ! "ninety" הונדערט:הונדערט NUM ; ! "hundred" טויזנט:טויזנט NUM ; ! "thousand" ! FIXME: plural טױזנטער מיליאָן:מיליאָן NUM ; ! "million" ! FIXME: plural מיליאָנען אײנס:ערשט NUM-ORD-ADJ ; צװײ:צװײט NUM-ORD-ADJ ; דרײַ:דריט NUM-ORD-ADJ ; פֿיר:פֿערט NUM-ORD-ADJ ; פֿינף:פֿינפֿט NUM-ORD-ADJ ; זעקס:זעקסט NUM-ORD-ADJ ; זיבן:זיבעט NUM-ORD-ADJ ; אַכט:אַכט NUM-ORD-ADJ ; נײַן:נײַנט NUM-ORD-ADJ ; צען:צענט NUM-ORD-ADJ ; ! "tenth" עלף:עלפֿט NUM-ORD-ADJ ; ! "eleventh" צװעלף:צוועלפֿט NUM-ORD-ADJ ; ! "twelfth" דרײַצן:דרײַצנט NUM-ORD-ADJ ; ! "thirteenth" פֿערצן:פֿערצנט NUM-ORD-ADJ ; ! "fourteenth" פֿופֿצן:פֿופֿצנט NUM-ORD-ADJ ; ! "fifteenth" זעכצן:זעכצנט NUM-ORD-ADJ ; ! "sixteenth" זיבעצן:זיבעצנט NUM-ORD-ADJ ; ! "seventeenth" אַכצן:אַכצנט NUM-ORD-ADJ ; ! "eighteenth" נײַנצן:נײַנצנט NUM-ORD-ADJ ; ! "nineteenth" צװאַנציק:צװאַנציקסט NUM-ORD-ADJ ; ! "twentieth" דרײַסיק:דרײַסיקסט NUM-ORD-ADJ ; ! "thirtieth" פֿערציק:פֿערציקסט NUM-ORD-ADJ ; ! "fortieth" פֿופֿציק:פֿופֿציקסט NUM-ORD-ADJ ; ! "fiftieth" זעכציק:זעכציקסט NUM-ORD-ADJ ; ! "sixtieth" זיבעציק:זיבעציקסט NUM-ORD-ADJ ; ! "seventieth" אַכציק:אַכציקסט NUM-ORD-ADJ ; ! "eightieth" נײַנציק:נײַנציקסט NUM-ORD-ADJ ; ! "ninetieth" הונדערט:הונדערטסט NUM-ORD-ADJ ; ! "hundredth" טויזנט:טויזנטסט NUM-ORD-ADJ ; ! "thousandth" LEXICON Titles הרבֿ%:הרבֿ # ; ! "rabbi" רב%:רב # ; ! "reb (mister)" מרת%:מרת # ; ! "Mrs." LEXICON Punctuation %.%:%. # ; %.%.%:%.%. # ; %.%.%.%:%.%.%. # ; …%:… # ; %;%:%; # ; %:%:%: # ; %!%:%! # ; %-%-%:%-%- # ; %-%:%- # ; %−%:%− # ; %—%:%— # ; %–%:%– # ; ,%:, # ; %?%:%? # ; %'%:%' # ; %"%:%" # ; %«%:%« # ; %»%:%» # ; %”%:%” # ; %“%:%“ # ; %(%:%( # ; %]%:%] # ; %[%:%[ # ; %)%:%) # ; %\%:%\ # ; %/%:%/ # ; LEXICON Digits ! Use/Circ %0:%0 NUM ; ! Use/Circ №:№ DIGITLEX ; ! Use/Circ №% :№% DIGITLEX ; ! Use/Circ DIGITLEX ; ! Use/Circ <[%- | %− | %+ ]> DIGITLEX ; ! Use/Circ LASTDIGIT ; ! Use/Circ LASTDIGIT-REST ; ! Use/Circ ! Resources: ! https://wiki.apertium.org/wiki/Starting_a_new_language_with_HFST#Lexicon ! https://wiki.apertium.org/wiki/Lttoolbox_and_lexc ! https://wiki.apertium.org/wiki/Apertium-specific_conventions_for_lexc ! https://kitwiki.csc.fi/twiki/bin/view/KitWiki/HfstHome ! http://hfst.sourceforge.net/ ! http://www.cis.upenn.edu/~cis639/docs/lexc.html ! https://wiki.apertium.org/wiki/Hfst