站长之家(ChinaZ.com)10月17日信息: 卡内基梅隆大学(CMU)和GoogleDeepMind的钻研人员引入了一种打破性的方法,称为""。该方法应用间接反向流传来微调文本到图像分散模型,处置了将这些模型与所需的处罚性能对齐的应战。AlignProp提供了一种更高效和有效的形式来优化文本到图像分散模型,实用于图像生成等畛域。
名目地址:
概率分散模型的崛起
概率分散模型曾经成为延续畛域生成建模的规范。DALLE,一种文本到图像分散模型,曾经成为该畛域的。这些模型以其能够经过在宽泛的网络规模数据集上训练来生成图像的才干而知名。但是,它们的无监视或弱监视性质使得在下游义务中控制其行为,如优化图像品质、图像文本对齐或伦理图像生成成为一项具有应战性的义务。
微调分散模型的应战
最近的尝试经常使用强化学习技术来微调分散模型受制于梯度预算中的高方差。AlignProp经过在去噪环节中启用处罚梯度的端到端反向流传,从而对这一疑问提供了翻新性的处置方案,将分散模型与所需的处罚性能对齐。
AlignProp的翻新特点:
AlignProp引入了一些翻新特点,以提高微调分散模型的效率:
减轻高内存需求:AlignProp经过微调低秩适配器权重模块和实施梯度审核点来减轻理论与现代文本到图像模型的反向流传相关的高内存需求。
性能评价:钻研论文评价了AlignProp在微调分散模型以成功各种指标的性能,包含图像文本语义对齐、美学、图像可紧缩性以及生成图像中对象数量的可控性等指标的性能。AlignProp在较少的训练步骤中成功了更高的处罚,胜过了其余方法。
概念上的繁难性:AlignProp因其概念上的繁难性而备受赞誉,使其成为基于可辨别处罚函数的分散模型优化的理智选用。
提高采样效率和计算有效性
AlignProp应用从处罚函数取得的梯度来微调分散模型。这种方法提高了采样效率和计算有效性。试验分歧标明,AlignProp在优化一系列处罚函数方面的有效性,甚至关于难以仅经过提醒定义的义务也是如此。
未来的钻研方向
未来,钻研人员可以探求将AlignProp的准则裁减到基于分散的言语模型,以增强其与人类反应的分歧性。
欢迎大家参与AiBase交换群,扫码进入,畅谈AI赚钱心得,共享最新行业灵活,发现潜在协作同伴,迎接未来的赚钱时机!。
(揭发)
AI正版系统源码介绍:小狐狸GPT-AI付费创作系统+开源可二开+私有常识库+聚合15家干流AI接口
标签: AlignProp、