Loading...

热门

NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置

智源社区2年前 (2023)发布智源社区

578 0 0

预训练语言模型通过微调的方式在文本生成任务中取得了显著的进展，但是在数据稀疏的场景下，通常无法直接进行微调。因此，本文提出基于prompt的迁移学习的设定。作者先为源领域上的不同任务分别学习一个prompt，从而构造prompt池，然后在目标任务进行迁移。为了同时考虑任务层面和实例层面的信息，作者设计了一个自适应的注意力机制，对于目标任务中的每个实例样本，模型都会为其选择与其最相关的源任务的prompt。作者在多种生成任务和数据集上进行了实验，结果表明作者提出的迁移方法可以很好地提高目标任务上的生成效果。

NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置

论文标题：

Learning to Transfer Prompts for Text Generation

论文链接:

https://arxiv.org/abs/2205.01543

# 智源社区 # 自然语言处理 # prompt # Prompts # 数据集 # 自然语言处理 # 论文

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

中科大&美团提出VIRT，从交互模型中蒸馏知识，在文本匹配上实现性能和效率的平衡！

智源社区

598

（待会删）yyds，请低调使用！

智源社区

544

冠军获奖经历：这一路我们不孤单！

智源社区

640

谷歌&斯坦福｜DoReMi方法优化预训练数据领域的混合比例，加速大模型语言训练

智源社区

1,404

数学能力超过ChatGPT！上海交大计算大模型登开源榜首

智源社区

506

北京邮电大学|用于成本和延迟敏感的虚拟网络功能放置和路由的多智能体深度强化学习

智源社区

583

暂无评论

暂无评论...

这是一个专注于人工智能产品的导航站。

关于我们友情链接

Copyright © 2025 Ai导航鄂ICP备2023001728号