ó
    ±oiØ<  ã                   ó²   • S SK r S SKrS SKJr  S SKJrJrJr  S SKJ	r	J
r
  S SKJr  S SKJrJrJrJrJrJr  S SKJr  SS	KJr  SS
KJrJrJr   " S S\
5      rg)é    N)ÚConv1D)Úis_bnb_4bit_availableÚis_bnb_availableÚis_gptqmodel_available)Ú
LoraConfigÚ	LoraModel)ÚBaseTunerLayer)Ú5TRANSFORMERS_MODELS_TO_ADALORA_TARGET_MODULES_MAPPINGÚ_freeze_adapterÚ_get_submodulesÚget_auto_gptq_quant_linearÚget_gptqmodel_quant_linearÚget_quantization_config)Úgather_params_ctxé   )ÚSVDQuantLinear)ÚAdaLoraLayerÚRankAllocatorÚ	SVDLinearc                   ó€   ^ • \ rS rSrSr\rU 4S jrS\SS4U 4S jjr	S r
\SS	 j5       rS
 rS rS rS rS rSrU =r$ )ÚAdaLoraModelé%   a”  
Creates AdaLoRA (Adaptive LoRA) model from a pretrained transformers model. Paper:
https://openreview.net/forum?id=lq62uWRJjiY

Args:
    model ([`transformers.PreTrainedModel`]): The model to be adapted.
    config ([`AdaLoraConfig`]): The configuration of the AdaLora model.
    adapter_name (`str`): The name of the adapter, defaults to `"default"`.
    low_cpu_mem_usage (`bool`, `optional`, defaults to `False`):
        Create empty adapter weights on meta device. Useful to speed up the loading process.

Returns:
    `torch.nn.Module`: The AdaLora model.

Example::

    >>> from transformers import AutoModelForSeq2SeqLM >>> from peft import LoraConfig, AdaLoraModel, AdaLoraConfig
    >>> config = AdaLoraConfig(
            peft_type="ADALORA", task_type="SEQ_2_SEQ_LM", init_r=12, lora_alpha=32, target_modules=["q", "v"],
            lora_dropout=0.01,
        )
    >>> model = AutoModelForSeq2SeqLM.from_pretrained("t5-base") >>> model = AdaLoraModel(model, config, "default")

**Attributes**:
    - **model** ([`transformers.PreTrainedModel`]) -- The model to be adapted.
    - **peft_config** ([`AdaLoraConfig`]): The configuration of the AdaLora model.
c                 óž  >• [         TU ]  " XU40 UD6  SnU R                  R                  5        H  nUR                  (       a  M  US-  nM     US:”  a  [        S5      eU R                  U   R                  (       a  [        U R                  U5        g X0l        [        U R                  U R                  U   U R                  5      U l
        g )Nr   r   z›AdaLoraModel supports only 1 trainable adapter. When using multiple adapters, set inference_mode to True for all adapters except the one you want to train.)ÚsuperÚ__init__Úpeft_configÚvaluesÚinference_modeÚ
ValueErrorr   ÚmodelÚtrainable_adapter_namer   Úrankallocator)Úselfr    ÚconfigÚadapter_nameÚkwargsÚtraininable_mode_counterÚ	__class__s         €ÚS/home/james-whalen/.local/lib/python3.13/site-packages/peft/tuners/adalora/model.pyr   ÚAdaLoraModel.__init__E   s»   ø€ Ü‰Ò˜¨Ñ?¸Ò?à#$Ð Ø×&Ñ&×-Ñ-Ö/ˆFØ×(×(Ñ(Ø(¨AÑ-Ò(ñ 0ð $ aÓ'Üð~óð ð
 ×Ñ˜LÑ)×8×8Ü˜DŸJ™J¨Õ5à*6Ô'Ü!.¨t¯z©z¸4×;KÑ;KÈLÑ;YÐ[_×[vÑ[vÓ!wˆDÕó    r$   ÚreturnNc                 óê   >• [         TU ]  U5        SnU R                  R                  5        H  nUR                  (       a  M  US-  nM     US:”  a"  [        U R                  R                   S35      eg)z´
A helper method to check the config when a new adapter is being added.

Raise a ValueError if there is something wrong with the config or if it conflicts with existing adapters.

r   r   z supports only 1 trainable adapter. When using multiple adapters, set inference_mode to True for all adapters except the one you want to train.N)r   Ú_check_new_adapter_configr   r   r   r   r(   Ú__name__)r#   r$   r'   Úconfig_r(   s       €r)   r.   Ú&AdaLoraModel._check_new_adapter_configY   s~   ø€ ô 	‰Ñ)¨&Ô1à#$Ð Ø×'Ñ'×.Ñ.Ö0ˆGØ×)×)Ñ)Ø(¨AÑ-Ò(ñ 1ð $ aÓ'ÜØ—>‘>×*Ñ*Ð+ð ,%ð %óð ð (r+   c                 óþ  • UR                   UR                  UR                  UR                  UR                  [        U R                  SS5      [        U R                  SS5      S.nUS   (       d
  US   (       a  [        5       (       d  [        S5      e[        U R                  SS	9nUb  X‡S
'   [        U[        5      (       d|  [        U R                  S5      (       a  U R                  R                  OS n	U R                  " XU4SU	0UD6n
X R                  ;  a  U
R!                  S5        U R#                  XTX£5        g UR%                  UUR                   UR                  UR                  UR                  5        g )NÚis_loaded_in_8bitFÚis_loaded_in_4bit)ÚrÚ
lora_alphaÚlora_dropoutÚfan_in_fan_outÚinit_lora_weightsÚloaded_in_8bitÚloaded_in_4bitr:   r;   z†To use AdaLora with 8-bit quantization, please install the `bitsandbytes` package. You can install it with `pip install bitsandbytes`.Úgptq)ÚmethodÚgptq_quantization_configÚhf_device_mapÚ
device_map)Úinit_rr6   r7   r8   r9   Úgetattrr    r   ÚImportErrorr   Ú
isinstancer   Úhasattrr?   Ú_create_new_moduleÚactive_adaptersÚrequires_grad_Ú_replace_moduleÚupdate_layer)r#   Úlora_configr%   ÚtargetÚtarget_nameÚparentÚcurrent_keyr&   Úquantization_configr@   Ú
new_modules              r)   Ú_create_and_replaceÚ AdaLoraModel._create_and_replacen   sY  € ð ×#Ñ#Ø%×0Ñ0Ø'×4Ñ4Ø)×8Ñ8Ø!,×!>Ñ!>Ü% d§j¡jÐ2EÀuÓMÜ% d§j¡jÐ2EÀuÓMñ
ˆð Ð#×$¨Ð/?×(@ÔJZ×J\ÑJ\ÜðFóð ô
 6°d·j±jÈÑPÐØÑ*Ø1DÐ-Ñ.ô ˜&¤,×/Ñ/Ü5<¸T¿Z¹ZÈ×5YÑ5Y˜Ÿ™×1Ò1Ð_cˆJØ×0Ò0°ÈFÑtÐ_iÐtÐmsÑtˆJØ×#7Ñ#7Ó7à×)Ñ)¨%Ô0Ø× Ñ  °jÕIà×ÑØØ×"Ñ"Ø×&Ñ&Ø×(Ñ(Ø×-Ñ-õr+   c                 óD  • [        5       (       a
  SS KnSSKJn  [	        5       (       a  SSKJn  UR                  SS 5      n[        5       (       a
  [        XƒS9n	O[        U5      n	UR                  SS5      n
UR                  S	S5      n[        U[        5      (       a  UR                  5       nOUnU
(       aw  [        UWR                  R                  5      (       aR  UR!                  UR"                  R$                  UR"                  R&                  UR(                  S
.5        W" X!40 UD6nU$ U(       a–  [	        5       (       a‡  [        UWR                  R*                  5      (       ab  UR-                  5       nUR!                  UR.                  UR0                  R2                  UR0                  R4                  S.5        W" X!40 UD6nU$ U	b  [        X)5      (       a  [7        X!40 UD6nU$ [        U[8        R                  R:                  5      (       a-  US   (       a"  [<        R>                  " S5        S=US'   U l         OQ[        U[B        5      (       a-  US   (       d"  [<        R>                  " S5        S=US'   U l         O[E        SU S35      e[G        X!40 UD6nU$ )Nr   r   )ÚSVDLinear8bitLt)ÚSVDLinear4bitr>   )r@   r:   Fr;   )Úhas_fp16_weightsÚ	thresholdÚindex)Úcompute_dtypeÚcompress_statisticsÚ
quant_typer8   zjfan_in_fan_out is set to True but the target module is `torch.nn.Linear`. Setting fan_in_fan_out to False.zafan_in_fan_out is set to False but the target module is `Conv1D`. Setting fan_in_fan_out to True.TzTarget module zP is not supported. Currently, only `torch.nn.Linear` and `Conv1D` are supported.)$r   ÚbitsandbytesÚbnbrU   r   rV   Úgetr   r   r   ÚpoprD   r	   Úget_base_layerÚnnÚLinear8bitLtÚupdateÚstaterW   rX   rY   Ú
Linear4bitÚcopyrZ   Úweightr[   r\   r   ÚtorchÚLinearÚwarningsÚwarnr8   r   r   r   )rK   r%   rL   r@   r&   r^   rU   rV   r>   ÚQuantLinearr:   r;   Útarget_base_layerrQ   Úfourbit_kwargss                  r)   rF   ÚAdaLoraModel._create_new_module›   sq  € ô ×ÑÛ&å,Ü ×"Ñ"Ý*à#)§:¡:Ð.HÈ$Ó#OÐ ä!×#Ñ#Ü4Ð5MÑe‰Kä4Ð5MÓNˆKàŸ™Ð$4°eÓ<ˆØŸ™Ð$4°eÓ<ˆäfœn×-Ñ-Ø &× 5Ñ 5Ó 7Ñà &ÐæœjÐ):¸C¿F¹F×<OÑ<O×PÑPØM‰Mà(9×(?Ñ(?×(PÑ(PØ!2×!8Ñ!8×!BÑ!BØ.×4Ñ4ñôñ )¨ÑHÀÑHˆJðF ÐöE Ô 5× 7Ñ 7¼JÐGXÐZ]×Z`ÑZ`×ZkÑZk×<lÑ<lØ#Ÿ[™[›]ˆNØ×!Ñ!à%6×%DÑ%DØ+<×+CÑ+C×+WÑ+WØ"3×":Ñ":×"EÑ"Eñôñ ' vÑN¸~ÑNˆJð2 Ðð1 Ñ$¬°F×)HÑ)HÜ'¨ÑGÀÑGˆJð. Ðô+ Ð+¬U¯X©X¯_©_×=Ñ=ØÐ*×+Ü—M’Mð;ôð MRÐQFÐ+Ñ,¨{Ô/IøÜÐ-¬v×6Ñ6ØÐ.×/Ü—M’Mð:ôð MQÐPFÐ+Ñ,¨{Ô/Iøä Ø$ V Hð -Tð Uóð ô # 6ÑB¸6ÑBˆJàÐr+   c                 óÌ  • U R                   R                  " U0 UD6n[        USS 5      Gb§  [        UR                  [
        R                  5      (       Ga}  U R                  U R                     R                  nUS::  a  [        S5      eSnSnU R                   R                  5        GH  u  pxSU;   d  SU;   d  M  U R                  U;   d  M&  UR                  [
        R                  " S/5      :X  a6  [        X€S9   SU;   a  XˆR                  -  OUR                  U-  n	S S S 5        O#SU;   a  XˆR                  -  OUR                  U-  n	[
        R                   " W	R#                  5       S[
        R$                  " U	5      06n
SU
l        US	-  nU[
        R(                  " Xš-
  S
S9-  nGM     US:”  a  XV-  nOSnU=R                  XE-  -  sl        U$ ! , (       d  f       N—= f)NÚlossr   z*orth_reg_weight should be greater than 0. Úlora_AÚlora_B)Ú
fwd_moduleÚoutFr   Úfro)Úp)r    ÚforwardrB   rD   rr   ri   ÚTensorr   r!   Úorth_reg_weightr   Únamed_parametersÚshapeÚSizer   ÚTÚeyeÚsizeÚ
empty_likeÚrequires_gradÚnorm)r#   Úargsr&   Úoutputsr{   Ú	regu_lossÚ	num_paramÚnrx   Úpara_covÚIs              r)   ry   ÚAdaLoraModel.forwardá   s  € Ø—*‘*×$Ò$ dÐ5¨fÑ5ˆäG˜V TÓ*Ò6¼JÀwÇ|Á|ÔUZ×UaÑUa×<bÒ<bà"×.Ñ.¨t×/JÑ/JÑK×[Ñ[ˆOà !Ó#Ü Ð!MÓNÐNàˆIØˆIØŸ
™
×3Ñ3×5‘Ø “M X°¥]¸×8SÑ8SÐWXÕ8XØ—w‘w¤%§*¢*¨a¨S£/Ó1Ü.¨qÓBØ2:¸a³- q¯3©3¢wÀQÇSÁSÈ1ÁW˜H÷ CÐBð /7¸!«m 1§s¡s¢7ÀÇÁÀqÁ˜ÜŸ	š	 8§=¡=£?ÐS¼×8HÒ8HÈÓ8RÑSAØ&+A”OØ ‘NIØ¤§¢¨H©L¸EÑ!BÑB“Iñ 6ð ˜1‹}Ø%Ñ1‘	à	ØLŠL˜OÑ7Ñ7LØˆ÷ CÕBús   Ã<$GÇ
G#	c                 ól  • U R                   U   nUR                  5        GHý  u  pE[        U[        5      (       a  [	        U5      nOZ[        U[
        R                  5      (       a0  UR                  S5      nUR	                  5       R                  5       nO[        S5      eX$;   a#  SR                  UR                  S5      SS 5      O"SR                  UR                  S5      SS 5      n[        U R                  U5      u  p‰nU	R                  U   U   n
U	R                  U   U   nU	R                   U   S S 2U4   nU	R"                  U   nU	R%                  UUUR&                  UR(                  UR*                  5        [
        R,                  " 5          US:”  ax  U	R                  U   R/                  U
5        U	R                  U   R/                  U5        U	R                   U   R/                  U5        U	R"                  U   R/                  U5        S S S 5        GM      g ! , (       d  f       GM  = f)NéÿÿÿÿzUnexpected type of rank_idxÚ.r   éþÿÿÿ)r   ÚitemsrD   ÚlistÚsumri   rz   ÚviewÚitemr   ÚjoinÚsplitr   r    Úlora_Ers   rt   ÚranknumrJ   r6   r7   r9   Úno_gradÚcopy_)r#   Úrank_patternr%   rK   ÚnameÚrank_idxÚrankÚkeyÚ_rL   Úlora_E_weightsÚlora_A_weightsÚlora_B_weightsr™   s                 r)   Úresize_modules_by_rank_patternÚ+AdaLoraModel.resize_modules_by_rank_patternÿ   sÊ  € Ø×&Ñ& |Ñ4ˆØ*×0Ñ0×2‰NˆDÜ˜(¤D×)Ñ)Ü˜8“}‘Ü˜H¤e§l¡l×3Ñ3Ø#Ÿ=™=¨Ó,Ø—|‘|“~×*Ñ*Ó,‘ä Ð!>Ó?Ð?Ø5AÓ5I#—(‘(˜4Ÿ:™: c›?¨1¨RÐ0Ô1ÈsÏxÉxÐX\×XbÑXbÐcfÓXgÐhiÐjlÐXmÓOnˆCÜ*¨4¯:©:°sÓ;‰LˆAqØ#Ÿ]™]¨<Ñ8¸ÑBˆNØ#Ÿ]™]¨<Ñ8¸ÑBˆNØ#Ÿ]™]¨<Ñ8º¸H¸ÑEˆNØ—n‘n \Ñ2ˆGØ×ÑØØØ×&Ñ&Ø×(Ñ(Ø×-Ñ-ôô —’•Ø˜!“8Ø—M‘M ,Ñ/×5Ñ5°nÔEØ—M‘M ,Ñ/×5Ñ5°nÔEØ—M‘M ,Ñ/×5Ñ5°nÔEà—N‘N <Ñ0×6Ñ6°wÔ?÷ !’ò+ 3÷* !—ús   ÆA?H#È#
H3	c                 ó¬  • UR                  5        H¿  u  pE[        U5      nX4;   a#  SR                  UR                  S5      SS 5      O"SR                  UR                  S5      SS 5      nS H^  nSU SU SU 3n	US:w  a$  XbU	   R                  S   :w  a  X)   U   OX)   X)'   M8  XbU	   R                  S   :w  a  X)   S S 2U4   OX)   X)'   M`     MÁ     U$ )	Nr   r   r   rŽ   )r˜   rs   rt   zbase_model.model.rt   r   )r‘   r“   r–   r—   r}   )
r#   rœ   Ú
state_dictr%   r   rž   rŸ   ÚprefixÚlayerr    s
             r)   Ú!resize_state_dict_by_rank_patternÚ.AdaLoraModel.resize_state_dict_by_rank_pattern  sö   € Ø*×0Ñ0Ö2‰NˆDÜx“=ˆDØ8DÓ8LS—X‘X˜dŸj™j¨›o¨a°Ð3Ô4ÐRU×RZÑRZÐ[_×[eÑ[eÐfiÓ[jÐklÐmoÐ[pÓRqˆFÛ7Ø)¨&¨°°5°'¸¸<¸.ÐIØ˜HÓ$à59È¹_×=RÑ=RÐSTÑ=UÓ5U˜
™¨Ò1Ð[eÑ[jð “Oð
 9=È3Á×@UÑ@UÐVWÑ@XÓ8X˜
™ª¨8¨Ò4Ð^hÑ^mð “Oó 8ñ 3ð Ðr+   c                 ó>  • U R                   U R                     nXR                  UR                  -
  :  a7  U R                  R                  U R                  U5      u  p4U(       a  XBl        ggXR                  UR                  -
  :X  aH  U R                  R                  U R                  USS9u  p4XBl        U R                  R                  5         gXR                  UR                  -
  :”  a1  U R                  R                  U R                  UR                  5        gg)aÝ  
This method updates Adalora budget and mask.

This should be called in every training step after `loss.backward()` and before `zero_grad()`.

`tinit`, `tfinal` and `deltaT` are handled with in the method.

Args:
    global_step (`int`): The current training step, it is used to calculate adalora budget.

Example:

```python
>>> loss = model(**input).loss
>>> loss.backward()
>>> optimizer.step()
>>> model.base_model.update_and_allocate(i_step)
>>> optimizer.zero_grad()
```
T)Ú
force_maskN)
r   r!   Ú
total_stepÚtfinalr"   Úupdate_and_allocater    rœ   Ú	reset_iptÚmask_using_rank_pattern)r#   Úglobal_steprK   r¡   rœ   s        r)   r±   Ú AdaLoraModel.update_and_allocate.  sô   € ð* ×&Ñ& t×'BÑ'BÑCˆà×/Ñ/°+×2DÑ2DÑDÓDØ"×0Ñ0×DÑDÀTÇZÁZÐQ\Ó]‰OˆAÞØ+7Õ(ð ð ×2Ñ2°[×5GÑ5GÑGÓGØ"×0Ñ0×DÑDÀTÇZÁZÐQ\ÐimÐDÐn‰OˆAð (4Ô$Ø×Ñ×(Ñ(Õ*ð ×1Ñ1°K×4FÑ4FÑFÓFØ×Ñ×6Ñ6°t·z±zÀ;×C[ÑC[Õ\ð r+   c                 óF   • [        U R                  R                   S35      e)z;This method is not supported for AdaLoRA, use LoRA instead.z. does not support add_weighted_adapter method.)Ú	TypeErrorr(   r/   )r#   r…   r&   s      r)   Úadd_weighted_adapterÚ!AdaLoraModel.add_weighted_adapterX  s    € ä˜4Ÿ>™>×2Ñ2Ð3Ð3aÐbÓcÐcr+   )r"   r!   )N)r/   Ú
__module__Ú__qualname__Ú__firstlineno__Ú__doc__r
   Útarget_module_mappingr   r   r.   rR   ÚstaticmethodrF   ry   r¥   r«   r±   r¸   Ú__static_attributes__Ú__classcell__)r(   s   @r)   r   r   %   si   ø† ñð: RÐõxð(°
ð ¸t÷ ò*+ðZ óCó ðCòJò<@ò>ò (÷Tdð dr+   r   )rk   ri   Útransformers.pytorch_utilsr   Úpeft.import_utilsr   r   r   Úpeft.tuners.lorar   r   Úpeft.tuners.tuners_utilsr	   Ú
peft.utilsr
   r   r   r   r   r   Úpeft.utils.integrationsr   r<   r   rª   r   r   r   r   © r+   r)   Ú<module>rÉ      sD   ðó ã Ý -ç ]Ñ ]ß 2Ý 3÷÷ õ 6å  ß 9Ñ 9ôud9õ udr+   