适配器微调(Adapter-tuning)篇.pdf

文档页数：1

文档大小：90.58KB

文档格式：pdf

文档分类：计算机与AI

上传会员：标准资料

上传日期：2026-06-04

最后更新：2026-06-04

一、为什么需要适配器微调（Adapter-tuning）？

预训练模型参数量变多，在特定任务下进行全量微调即昂贵又耗时：

二、适配器微调（Adapter-tuning）思路？

设计了Adapter结构（首先是一个down-project层将高维度特征映射到低维特征，然后过一计了skip-connection 结构，确保了在最差的情况下能够退化为 identity），并将其嵌入个非线形层之后，再用一个up-project结构将低维特征映射回原来的高维特征：同时也设Transformer的结构里面：

在训练时，固定住原来预训练模型的参数不变，只对新增的Adapter结构进行微调.同时为了保证训练的高效性（也就是尽可能少的引入更多参数）.

三、适配器微调（Adapter-tuning）特点是什么？

特点：

通过在Transformer层中嵌入Adapter结构，在推理时会额外增加推理时长.

四、AdapterFusion思路是什么？

思路：一种融合多任务信息的Adapter的变体，在Adapter的基础上进行优化，通过将学习过程分为两阶段来提升下游任务表现.

五、AdapterDrop思路是什么？

思路：在不影响任务性能的情况下，对Adapter动态高效的移除，尽可能的减少模型的参数量，提高模型在反向传播（训练）和正向传播（推理）时的效率.

六、AdapterDrop特点是什么？

特点：

通过从较低的Transformer层删除可变数量的Adaper来提升推理速度：当对多个任务执行推理时，动态地减少了运行时的计算开销，并在很大程度上保持了任务性能.

七、MAMAdapter思路是什么？

思路：一种在Adapter、PrefixTuning和LoRA之间建立联系的统一方法.最终的模型MAMAdapter是用于FFN的并行Adapter和软提示的组合.

八、MAMAdapter特点是什么？

特点：

整体上来说，最终的模型MAMAdapter效果会优于单个高效微调方法.

资源链接请先登录（扫码可直接登录、免注册）

①本文档内容版权归属内容提供方。如果您对本资料有版权申诉，请及时联系我方进行处理（联系方式详见页脚）。
②由于网络或浏览器兼容性等问题导致下载失败，请加客服微信处理（详见下载弹窗提示），感谢理解。
③本资料由其他用户上传，本站不保证质量、数量等令人满意，若存在资料虚假不完整，请及时联系客服投诉处理。
④本站仅收取资料上传人设置的下载费中的一部分分成，用以平摊存储及运营成本。本站仅为用户提供资料分享平台，且会员之间资料免费共享（平台无费用分成），不提供其他经营性业务。

投稿会员：标准资料

适配器微调(Adapter-tuning)篇.pdf

推荐内容/By 规范库

手机扫码、免注册、直接登录