每日学术速递3.22
创始人
2025-06-01 12:58:49
0

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CV

1.DS-Fusion: Artistic Typography via Discriminated and Stylized Diffusion

标题:DS-Fusion:通过辨别和程式化扩散的艺术排版

作者:Maham Tanveer, Yizhi Wang, Ali Mahdavi-Amiri, Hao Zhang

文章链接:https://arxiv.org/abs/2303.09604

项目代码:https://ds-fusion.github.io/

摘要:

        我们介绍了一种新颖的方法,通过对一种或多种字母字体进行风格化来自动生成艺术排版,以直观地传达输入词的语义,同时确保输出保持可读性。为了解决我们手头任务的各种挑战,包括相互冲突的目标(艺术风格化与易读性)、缺乏基本事实和巨大的搜索空间,我们的方法利用大型语言模型来桥接文本和视觉图像以进行风格化,并建立一个无监督的具有扩散模型骨干的生成模型。具体来说,我们在潜在扩散模型 (LDM) 中使用去噪生成器,并关键添加了一个基于 CNN 的鉴别器,以将输入样式适应输入文本。鉴别器使用给定字母/单词字体的光栅化图像作为真实样本,并将去噪生成器的输出作为假样本。我们的模型被创造为 DS-Fusion,用于区分和程式化的扩散。我们通过大量示例、定性和定量评估以及消融研究展示了我们方法的质量和多功能性。用户研究与包括 CLIPDraw 和 DALL-E 2 在内的强基线以及艺术家制作的排版进行比较,证明了 DS-Fusion 的强大性能。

2.HIVE: Harnessing Human Feedback for Instructional Visual Editing

标题:HIVE:利用人类反馈进行教学视觉编辑

作者:Jiayu Jiao, Yu-Ming Tang, Kun-Yu Lin, Yipeng Gao, Jinhua Ma, YaoWei Wang, Wei-Shi Zheng

文章链接:https://arxiv.org/abs/2303.09618

摘要:

        结合人类反馈已被证明对于使大型语言模型生成的文本与人类偏好保持一致至关重要。我们假设最先进的教学图像编辑模型,其中输出是根据输入图像和编辑指令生成的,同样可以从人类反馈中受益,因为它们的输出可能不符合用户的正确指令和偏好.在本文中,我们提出了一个新的框架来利用人类反馈进行教学可视化编辑 (HIVE)。具体来说,我们收集人类对编辑图像的反馈,并学习奖励函数来捕捉潜在的用户偏好。然后,我们介绍了可扩展的扩散模型微调方法,该方法可以根据估计的奖励结合人类偏好。此外,为了减轻数据限制带来的偏差,我们贡献了一个新的 1M 训练数据集、一个用于奖励学习的 3.6K 奖励数据集和一个 1K 评估数据集,以提高教学图像编辑的性能。我们在定量和定性方面进行了广泛的实证实验,表明 HIVE 在很大程度上优于以前最先进的教学图像编辑方法。

3.FreeDoM: Training-Free Energy-Guided Conditional Diffusion Model

标题:FreeDoM:无训练能量引导条件扩散模型

作者:Jiwen Yu, Yinhuai Wang, Chen Zhao, Bernard Ghanem, Jian Zhang

文章链接:https://arxiv.org/abs/2302.01660v2

项目代码:https://github.com/ysig/learnable-typewriter

摘要:

        最近,条件扩散模型因其出色的生成能力而在众多应用中受到欢迎。然而,许多现有方法需要训练。他们需要训练一个依赖时间的分类器或一个依赖条件的分数估计器,这增加了构建条件扩散模型的成本,并且不方便在不同条件下迁移。目前的一些工作旨在通过提出免训练解决方案来克服这一限制,但大多数只能应用于特定类别的任务,而不适用于更一般的条件。在这项工作中,我们提出了一种用于各种条件的无训练条件扩散模型 (FreeDoM)。具体来说,我们利用现成的预训练网络(例如人脸检测模型)来构建与时间无关的能量函数,该函数无需训练即可指导生成过程。此外,由于能量函数的构建非常灵活并且适应各种条件,我们提出的 FreeDoM 比现有的免训练方法具有更广泛的应用范围。 FreeDoM 的优势在于其简单性、有效性和低成本。实验表明,FreeDoM 在各种条件下都有效,适用于不同数据域(包括图像和潜在代码域)的扩散模型。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

相关内容

热门资讯

最新或2023(历届)关于中央...  今年的中央经济工作会议可以说是一次历史性的会议,不仅对明年的经济工作进行了全面的部署,更重要的是对...
中央城市工作会议公报学习心得体...   【第1篇】中央城市工作会议公报学习心得体会  最新或2023(历届)的中央经济工作会议放在12月...
村委干部入党申请书范文模板 2... 尊敬的党组织:20XX年报考大学生村官本是一次偶然的机会,没有想到这成为了我值得骄傲的工作。虽然没有...
最新或2023(历届)中央城市...   习近平在会上发表重要讲话,总结最新或2023(历届)经济工作,分析当前国内国际经济形势,部署最新...
最新或2023(历届)中央城市...   岁末的中国中央经济工作会议亮点不少,会议提出明年中国经济的五大任务:去产能、去库存、去杠杆、降成...
学习中央城市工作会议与规划工作...   【1】学习中央城市工作会议与规划工作心得体会  随着城镇化率超过50%,我国正进入以城市人口为主...
学习贯彻中央城市工作会议心得体...   【第1篇】学习贯彻中央城市工作会议心得体会  学习完中央城市工作会议之后,个人总结如下:  “十...
最新或2023(历届)中央城市...  【篇1】中央城市工作会议学习心得+规划  我们要把城市建设成为人与人、人与自然和谐共处的美丽家园,...
最新或2023(历届)中央城市...   【篇1】中央城市工作会议报告原文学习心得体会  最近,学习了中央城市工作会议报告之后有了以下的感...
最新或2023(历届)中央城市...   【范文1】中央城市工作会议的学习体会  中央经济工作会议提出“去产能、去库存、去杠杆、降成本、补...
市委省委宣传部最新或2023(...  一、指导思想  坚持以党的十八届五中全会、省委六届九次全会和市委十一届九次全会精神为指针,深入学习...
学习贯彻中央城市工作会议精神心...  【篇1】学习贯彻中央城市工作会议精神心得体会  中央经济工作会议公告称,降低企业负担是中国最新或2...
县委镇政府春节文化活动方案最新...  一、指导思想  最新或2023(历届)春节文化娱乐活动要以党的十八大精神为指导,推动社会主义文化大...
最新或2023(历届)春节元宵...  一、指导思想  深入贯彻落实党的十八届三中、四中全会精神,以“政府搭台、群众唱戏、文化惠民”为主题...
最新或2023(历届)学校教育... 为深入贯彻落实党的十八届三中全会和全省文化体制改革工作会议精神,深入开展民族团结进步创建活动,解放思...
最新或2023(历届)春节群众... 方案一:  一、指导思想  最新或2023(历届)我村春节文化活动的指导思想是:以宣传党的十七届五中...
最新或2023(历届)新春文化... 一、指导思想  进一步贯彻落实党的十八届五中全会精神及《中共中央宣传部关于最新或2023(历届)深入...
最新或2023(历届)街道社区...   一、指导思想  充分展现居民和职工群众新生活、新风尚、新面貌等时代气息,大力发展和繁荣社区文化,...
最新或2023(历届)春节期间...   一、指导思想  以“美丽xx、幸福xx、和谐xx”为主题,深入贯彻习近平总书记在文艺工作座谈会上...
镇政府最新或2023(历届)春...  一、组织领导  成立普安镇最新或2023(历届)春节群众文化活动领导小组,具体负责春节期间群众文化...