Loading...

热门

AWS AI Labs｜基于组合扩散模型的数据保护训练

大模型2年前 (2023)发布智源社区

558 0 0

Training Data Protection with Compositional Diffusion Models

Aditya Golatkar, Alessandro Achille, Ashwin Swaminathan, Stefano Soatto
[AWS AI Labs]

基于组合扩散模型的数据保护训练

动机：随着扩散模型在生成图像等方面的应用越来越广泛，如何保护大规模训练数据的问题变得越来越重要。这包括限制训练样本的影响、移除错误包含在训练中的样本的影响，以及防止模型记忆和生成与训练数据相似的样本等。
方法：提出Compartmentalized Diffusion Models(CDM)，一种训练不同扩散模型(或提示)在不同数据源上，并在推理时任意组合它们的方法。每个模型只包含其在训练期间接触到的数据子集的信息，从而实现了多种形式的训练数据保护。
优势：CDM是首个能实现大规模扩散模型的选择性遗忘和持续学习的方法，同时还允许根据用户的访问权限提供定制的模型。此外，CDM还可以确定生成特定样本时数据子集的重要性。

提出一种新的扩散模型，即Compartmentalized Diffusion Models(CDM)，可以在不同的数据源上独立训练，在推理时进行组合，从而实现了对训练数据的保护，其性能与同时在所有数据上训练的模型相当。

https://arxiv.org/abs/2308.01937

AWS AI Labs｜基于组合扩散模型的数据保护训练

# 大模型 # 智源社区 # 大模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Unlimiformer：具有无限长度输入的长距离Transformer模型

智源社区

1,246

ChatGPT中文语料库

智源社区

972

能「说」会「画」， VisCPM：SOTA 开源中文多模态大模型

智源社区

849

Nature ：生成式 AI 的前景与风险（二）【好文译递】第 6 期

智源社区

822

MMCU@中文通用大语言模型测试集预发布

智源社区

920

2023智源大会｜黄铁军：难以预测，无法闭幕

智源社区

685

暂无评论

暂无评论...

这是一个专注于人工智能产品的导航站。

关于我们友情链接

Copyright © 2025 Ai导航鄂ICP备2023001728号