
    h_                        S SK Jr  S SKr/ SQr/ SQr/ SQr\R                  R                  S/ SQ5      S 5       r\R                  R                  S	\5      \R                  R                  SS
/5      S 5       5       r	\R                  R                  S	\5      \R                  R                  SS
/5      S 5       5       r
\R                  R                  S	\5      \R                  R                  SS/5      \R                  R                  SS
/5      S 5       5       5       r\R                  R                  S	\5      \R                  R                  SS/5      \R                  R                  SS
/5      S 5       5       5       r\R                  R                  S	\5      \R                  R                  SS
/5      S 5       5       r\R                  R                  S	\5      \R                  R                  SS
/5      S 5       5       r\R                  R                  SS/5      S 5       r\R                  R                  SS/5      S 5       r\R                  R                  S\5      \R                  R                  SS/5      S 5       5       r\R                  R                  S\5      \R                  R                  SS/5      \R                  R                  SS/5      S 5       5       5       r\R                  R                  SS/5      S 5       rS  r\R                  R                  S/ S!Q5      S" 5       r\R                  R                  SS#S$/5      S% 5       rg)&    )punctuationN)([{*))]}r   ))r   r   )r   r	   )r   r
   )r   r   text)r   z((<c                 H    U " U5      n[        U5      [        U5      :X  d   eg )Nlenru_tokenizerr   tokenss      \/home/james-whalen/.local/lib/python3.13/site-packages/spacy/tests/lang/ru/test_tokenizer.py$test_ru_tokenizer_handles_only_punctr   
   s"    $Fv;#d)###    punctu   Приветc                     U " X-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg N   r      r   r   r   r   r   r   s       r   #test_ru_tokenizer_splits_open_punctr      sN     %,'Fv;!!9>>U"""!9>>T!!!r   c                     U " X!-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg r   r   r   s       r   $test_ru_tokenizer_splits_close_punctr      sN     $,'Fv;!!9>>T!!!!9>>U"""r   	punct_add`c                     U " X-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg N   r   r   r   r   r   r   r    r   r   s        r   ,test_ru_tokenizer_splits_two_diff_open_punctr&   "   sj     %+d23Fv;!!9>>U"""!9>>Y&&&!9>>T!!!r   'c                     U " X1-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg r#   r   r%   s        r   -test_ru_tokenizer_splits_two_diff_close_punctr)   -   si     $,23Fv;!!9>>T!!!!9>>U"""!9>>Y&&&r   c                     U " X-   U-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg )N   r   r$   r   r   s       r   (test_ru_tokenizer_splits_same_open_punctr,   8   sX     %-%/$67Fv;!!9>>U"""!9>>T!!!r   c                     U " X!-   U-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg )Nr+   r   r   r   r   s       r   )test_ru_tokenizer_splits_same_close_punctr.   A   sX     $,.67Fv;!!9>>T!!!!9>>U"""r   u	   'Тестc                 `    U " U5      n[        U5      S:X  d   eUS   R                  S:X  d   eg )Nr   r   r'   r   r   s      r   )test_ru_tokenizer_splits_open_appostropher0   J   s4    $Fv;!!9>>S   r   u
   Тест''c                 h    U " U5      n[        U5      S:X  d   eU " S5      n[        U5      S:X  d   eg )Nr   z''r   r   )r   r   r   tokens_puncts       r   )test_ru_tokenizer_splits_double_end_quoter3   Q   s;    $Fv;!%L|!!!r   zpunct_open,punct_closeu   Тестc                     U " X-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg r#   r   )r   
punct_openpunct_closer   r   s        r   )test_ru_tokenizer_splits_open_close_punctr7   Y   sj    
 *+k9:Fv;!!9>>Z'''!9>>T!!!!9>>[(((r   zpunct_open2,punct_close2)r!   r'   c                    U " X1-   U-   U-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg )N   r   r   r   r$   r+   r   )r   r5   r6   punct_open2punct_close2r   r   s          r    test_ru_tokenizer_two_diff_punctr<   e   s     +2T9KG,VWFv;!!9>>[(((!9>>Z'''!9>>T!!!!9>>[(((!9>>\)))r   u	   Тест.c                 >    U " U5      nUS   R                   S:X  d   eg )Nr   .)r   r   s      r   %test_ru_tokenizer_splits_trailing_dotr?   t   s"    $F!9>>S   r   c                 Z    SnU " U5      nU[        U5      S-
     R                  S:X  d   eg )Nu+   (Раз, два, три, проверка).r   r>   r   r   s      r   'test_ru_tokenizer_splits_bracket_periodrA   z   s2    8D$F#f+/"''3...r   )
uU   рекоменду́я подда́ть жару́. Самого́ БаргамотаuU   РЕКОМЕНДУ́Я ПОДДА́ТЬ ЖАРУ́. САМОГО́ БАРГАМОТАuT   рекоменду̍я подда̍ть жару̍.Самого̍ БаргамотаuU   рекоменду̍я подда̍ть жару̍.'Самого̍ БаргамотаuT   рекоменду̍я подда̍ть жару̍,самого̍ БаргамотаuT   рекоменду̍я подда̍ть жару̍:самого̍ БаргамотаuU   рекоменду̍я подда̍ть жару̍. самого̍ БаргамотаuU   рекоменду̍я подда̍ть жару̍, самого̍ БаргамотаuU   рекоменду̍я подда̍ть жару̍: самого̍ БаргамотаuT   рекоменду̍я подда̍ть жару̍-самого̍ Баргамотаc                 p    U " U5      nUS   R                   S;   d   eUS   R                   [        ;   d   eg )Nr   )u
   жару́u
   ЖАРУ́u
   жару̍r$   )r   r   r   s      r   *test_ru_tokenizer_handles_final_diacriticsrC      s;      $F!9>>GGGG!9>>[(((r   uT   РЕКОМЕНДУ́Я ПОДДА́ТЬ ЖАРУ́.САМОГО́ БАРГАМОТАuT   рекоменду̍я подда̍ть жару́.самого́ Баргамотаc                 Z    U " U5      nUS   R                   R                  5       S:X  d   eg )Nr   u   жару́.самого́)r   lowerr   s      r   4test_ru_tokenizer_handles_final_diacritic_and_periodrF      s.     $F!9>>!%@@@@r   )stringr   pytest
PUNCT_OPENPUNCT_CLOSEPUNCT_PAIREDmarkparametrizer   r   r   r&   r)   r,   r.   r0   r3   r7   r<   r?   rA   rC   rF    r   r   <module>rO      su    !
"? !12$ 3$
 *-.!12" 3 ." +..!12# 3 /# *-se,.!12" 3 - ." +.se,.!12' 3 - /' *-.!12" 3 ." +..!12# 3 /# +/! 0! ,0" 1" 1<@*.) / A) 1<@3j\B*.	* / C A	* +/! 0!
/ 
)) 
^^AAr   