
    h'                     <   S SK r / SQr/ SQr/ SQr\ R                  R                  S/ SQ5      S 5       r\ R                  R                  S\5      \ R                  R                  S/ S	Q5      S
 5       5       r\ R                  R                  S\5      \ R                  R                  S/ S	Q5      S 5       5       r\ R                  R                  S\5      \ R                  R                  SS/5      \ R                  R                  S/ S	Q5      S 5       5       5       r	\ R                  R                  S\5      \ R                  R                  SS/5      \ R                  R                  S/ S	Q5      S 5       5       5       r
\ R                  R                  S\5      \ R                  R                  S/ S	Q5      S 5       5       r\ R                  R                  S\5      \ R                  R                  S/ S	Q5      S 5       5       r\ R                  R                  SS/5      S 5       r\ R                  R                  SS/5      S 5       r\ R                  R                  S\5      \ R                  R                  S/ S	Q5      S 5       5       r\ R                  R                  S\5      \ R                  R                  SS/5      \ R                  R                  S/ S	Q5      S 5       5       5       r\ R                  R                  S/ SQ5      S 5       rS rS rg)     N)([{*))]}r   ))r   r   )r   r   )r   r	   )r   r   text)r   z((<c                 H    U " U5      n[        U5      [        U5      :X  d   eg )Nlenuk_tokenizerr
   tokenss      \/home/james-whalen/.local/lib/python3.13/site-packages/spacy/tests/lang/uk/test_tokenizer.py$test_uk_tokenizer_handles_only_punctr      s"    $Fv;#d)###    punct)u   Приветu   Привітu   Ґелґотатиu   З'єднанняu   Єдністьu   їхніc                     U " X-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg N   r      r   r
   r   r   r
   r   s       r   #test_uk_tokenizer_splits_open_punctr      sN    
 %,'Fv;!!9>>U"""!9>>T!!!r   c                     U " X!-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg r   r   r   s       r   $test_uk_tokenizer_splits_close_punctr      sN    
 $,'Fv;!!9>>T!!!!9>>U"""r   	punct_add`c                     U " X-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg N   r   r   r   r   r   r   r   r
   r   s        r   ,test_uk_tokenizer_splits_two_diff_open_punctr%   $   sj     %+d23Fv;!!9>>U"""!9>>Y&&&!9>>T!!!r   'c                     U " X1-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg r"   r   r$   s        r   -test_uk_tokenizer_splits_two_diff_close_punctr(   1   si     $,23Fv;!!9>>T!!!!9>>U"""!9>>Y&&&r   c                     U " X-   U-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg )N   r   r#   r   r   s       r   (test_uk_tokenizer_splits_same_open_punctr+   >   sX    
 %-%/$67Fv;!!9>>U"""!9>>T!!!r   c                     U " X!-   U-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg )Nr*   r   r   r   r   s       r   )test_uk_tokenizer_splits_same_close_punctr-   I   sX    
 $,.67Fv;!!9>>T!!!!9>>U"""r   u	   'Тестc                 `    U " U5      n[        U5      S:X  d   eUS   R                  S:X  d   eg )Nr   r   r&   r   r   s      r   )test_uk_tokenizer_splits_open_appostropher/   T   s4    $Fv;!!9>>S   r   u
   Тест''c                 h    U " U5      n[        U5      S:X  d   eU " S5      n[        U5      S:X  d   eg )Nr   z''r   r   )r   r
   r   tokens_puncts       r   )test_uk_tokenizer_splits_double_end_quoter2   [   s;    $Fv;!%L|!!!r   zpunct_open,punct_closec                     U " X-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg r"   r   )r   
punct_openpunct_closer
   r   s        r   )test_uk_tokenizer_splits_open_close_punctr6   c   sj     *+k9:Fv;!!9>>Z'''!9>>T!!!!9>>[(((r   zpunct_open2,punct_close2)r    r&   c                    U " X1-   U-   U-   U-   5      n[        U5      S:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eUS   R                  U:X  d   eg )N   r   r   r   r#   r*   r   )r   r4   r5   punct_open2punct_close2r
   r   s          r    test_uk_tokenizer_two_diff_punctr;   q   s     +2T9KG,VWFv;!!9>>[(((!9>>Z'''!9>>T!!!!9>>[(((!9>>\)))r   )u   Привет.u   Привіт.u   Ґелґотати.u   З'єднання.u   Єдність.u	   їхні.c                 >    U " U5      nUS   R                   S:X  d   eg )Nr   .r
   r   s      r   %test_uk_tokenizer_splits_trailing_dotr?      s$     $F!9>>S   r   c                 Z    SnU " U5      nU[        U5      S-
     R                  S:X  d   eg )Nu+   (Раз, два, три, проверка).r   r=   r   r   s      r   'test_uk_tokenizer_splits_bracket_periodrA      s2    8D$F#f+/"''3...r   c                 l    SnU " U5      nUS   R                   S:X  d   eUS   R                   S:X  d   eg )Nu?   Хлібі́в не було́. Хлібі́в не було́.r   u
   було́r#   r=   r>   r   s      r   *test_uk_tokenizer_handles_final_diacriticsrC      s=    LD$F!9>>\)))!9>>S   r   )pytest
PUNCT_OPENPUNCT_CLOSEPUNCT_PAIREDmarkparametrizer   r   r   r%   r(   r+   r-   r/   r2   r6   r;   r?   rA   rC    r   r   <module>rK      s%   !
"? !12$ 3$
 *-
u" ." +.
u# /# *-se,
u" - .
" +.se,
u' - /
' *-
u" ." +.
u# /# +/! 0! ,0" 1" 1<@
u) A) 1<@3j\B
u	* C A
	* 
{!!
/!r   