清华快手新方法训练提效6200倍SVG模型提速3500倍前脚谢赛宁刚宣告VAE在

量子位看科技 2025-10-28 16:45:30

清华快手新方法训练提效6200倍SVG模型提速3500倍

前脚谢赛宁刚宣告VAE在图像生成领域退役,后脚清华与快手可灵团队也带着无VAE潜在扩散模型SVG来了。

该方法实现了在训练效率上62倍、生成速度上35倍的提升。

VAE为何被接连抛弃?主要还是因为语义纠缠的缺陷——语义特征都放在同一个潜空间,调一个数值就会“牵一发而动全身”,比如只想改变猫的颜色,结果体型、表情都跟着变。

和谢赛宁团队极简复用预训练编码器、改造DiT架构,专注于生成性能的RAE不同,SVG通过语义+细节双分支+分布对齐,实现了多任务通用。

0 阅读:0
量子位看科技

量子位看科技

感谢大家的关注