🖼️ 利用编码器和模型进行音乐和图像理解,用户可编辑音乐、调整乐器和速度。
2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
**划重点:**体验地址:https://top.aibase.com/tool/m2ugen
腾讯推出的技术 Paint3D 能够根据文本或图像输入,在不具有内嵌光照信息的3D模型上生成高分辨率、无光照的多样化纹理贴图。