首页 > 监管平台

智象未来两项研究入选ICCV 2025,发布两项视觉生成突破性成果

监管平台 2025-07-18 11:31:44
2025年全球受监管的正规外汇交易商

XM平台 Exness平台 TMGM平台 德璞资本 ICMarkets FXTM富拓

查看全部

近日,智象未来团队两项创新成果入选ICCV 2025,分别聚焦于图像生成与视频增强两个方向,全面展示了其在生成式AI技术上的突破与领先。

在图像生成方面,智象未来团队提出了全新去噪掩码自回归生成范式De-MAR,解决了自回归模型在视觉生成中的关键瓶颈。自回归模型虽在语言领域大获成功,但在图像生成中存在细节表现力不足、推理速度慢等痛点。De-MAR框架通过双重令牌优化机制,创新性引入扩散头与去噪头模块:扩散头利用交叉注意力捕捉全局上下文,提升掩码区域预测精度;去噪头动态优化已知区域令牌,减少误差累积。实验显示,De-MAR在ImageNet和MS-COCO数据集上,FID指标达1.47和5.27的顶尖水平,生成速度较DiT-XL/2快45%,打破高质量与高效率不可兼得的困境,生成图像细节更丰富、伪影更少。

在视频增强方面,团队则推出了创新的生成式视频画质增强框架GenVE,攻克传统方法细节缺失难题。其核心在于双重对齐机制:通过图像扩散模型生成语义参考,确保全局布局一致;借助局部感知交叉注意力模块,精准迁移参考图像的纹理细节至视频。同时,多重增强策略提升模型鲁棒性:噪声增强平衡质量与保真度,时间增强强化帧间连贯性,掩码策略提升特征利用率。在YouHQ40、VideoLQ等数据集上,GenVE的MUSIQ、DOVER等指标全面领先,能生动还原毛发、衣物褶皱等细节,使视频画面更自然流畅。

这两项成果分别发表于ICCV 2025 论文《Denoising Token Prediction in Masked Autoregressive Models》和《Aligning Global Semantics and Local Textures in Generative Video Enhancement》,为视觉生成技术开辟新路径,推动高质量、高效率的多模态内容生成迈向实用化,未来有望在创意设计、影视制作等领域广泛应用。

免责声明

特别提示:根据《关于严厉查处非法外汇期货和外汇按金交易活动的通知》(证监发字[1994]165号)规定凡未经批准的机构在大陆境内擅自开展外汇期货交易均属非法,提高意识,谨防损失!本网站内容仅限于海外华人参考,不作任何投资建议! 目前澳大利亚、日本、欧洲、美国都仅允许本国监管券商才能在投资者所在国展开运营。新加坡和马来西亚等国没有强制要求。希望华人分清楚本国监管范围和交易高风险。

本网站所有刊登内容,以及所提供的信息资料,目的是为了更好地服务我们的访问者,本网站不保证所有信息、文本、图形、链接及其它项目的绝对准确性和完整性,网站没有任何盈利目的,故仅供访问者参照使用。本网站已尽力确保所有资料是准确、完整及最新的。就该资料的针对性、精确性以及特定用途的适合性而言,本网站不能作出最对应的方案。所以因依赖该资料所致的任何损失,本网均不负责。 除特别注明之服务条款外,其他一切因使用本站而引致的任何意外、疏忽、合约毁坏、隐秘汇漏、诽谤、版权或知识产权侵犯及其所造成的损失,本站概不负责,亦不承担任何法律责任。如您(单位或个人)认为本网站某部分内容有侵权嫌疑,敬请立即通知我们,我们将在第一时间予以更改或删除。以上声明之解释权归蓝鸭财经网站所有。法律上有相关解释的,以中国法律之解释为基准。如有争议限在我方所在地司法部门解决。