新零售网 > 观点 >

MIT重新构想图像生成标记器和解码器无需生成器即可进行编辑和修复

来源:盖世汽车 发布时间:2025-07-24 19:12   阅读量:5550   

盖世汽车讯 人工智能图像生成——依靠神经网络根据各种输入创建新图像——预计到本世纪末将成为一个价值数十亿美元的产业。即使以今天的技术,如果想要创作一幅奇特的画面,比如一位朋友在火星上插上国旗,或者漫不经心地飞进黑洞,也只需不到一秒钟。

然而,在图像生成器能够执行此类任务之前,它们通常需要接受海量数据集的训练,这些数据集包含数百万张图像,通常还配有相关文本。训练这些生成模型可能是一项艰巨的任务,需要数周甚至数月的时间,并且会消耗大量的计算资源。

但是,如果真的可以通过人工智能方法生成图像,而无需使用生成器,那会怎样呢?

据外媒报道,2025年夏初,在加拿大不列颠哥伦比亚省温哥华举行的国际机器学习大会上,一篇研究论文阐述了这种现实可能性以及其他一些引人入胜的想法。研究人员重新构想图像生成,使标记器和解码器无需生成器即可进行编辑和修复图像。相关论文已发表在arXiv预印本服务器上。

论文由麻省理工学院信息与决策系统实验室(LIDS)研究生研究员Lukas Lao Beyer、麻省理工学院计算机科学与人工智能实验室(CSAIL)博士后研究员Tianhong Li、Facebook人工智能研究中心的Xinlei Chen、麻省理工学院航空航天学教授兼LIDS主任Sertac Karaman以及麻省理工学院电气工程与计算机科学副教授Kaiming He共同撰写。

这项团队研究的起源是Lao Beyer去年秋季参加的深度生成模型研究生研讨课的课堂项目。在学期中的交流中,Lao Beyer和研讨课的授课老师He都意识到这项研究具有真正的潜力,远远超出了普通家庭作业的范畴。很快,其他合作者也加入了进来。

Lao Beyer的研究起点是一篇发表于2024年6月的论文,该论文由慕尼黑工业大学和中国公司字节跳动的研究人员共同撰写,该论文介绍了一种新的视觉信息表示方法,称为一维标记器。利用这种设备(它也是一种神经网络),可以将256x256像素的图像转换为仅由32个数字组成的序列,这些数字被称为标记。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

比亚迪海鸥领跑新能源市场,吉利星越L位列燃油车销量首位丨2025 2025-07-24 17:10

敦煌:用文明筑城向幸福出发 2025-07-24 17:00

吉利千里浩瀚夺冠国际智驾顶级赛事,首发L3级智驾解决方案坐稳第一 2025-07-24 15:29

二手车大数据专项报告:上半年车源扩容与价格承压并行新能源二手车车 2025-07-24 13:12

五菱之光EV305km进取型携7大升级进阶上市售价5.78万元 2025-07-24 12:48

东风再临变革时刻!日产初成、本田未捷,两大合资不同命 2025-07-24 10:34

美国对冲基金Millennium拟42亿美元注资两家外部对冲基金 2025-07-24 09:29

小马智行L4域控制器破200万公里路测,自动驾驶量产提速 2025-07-24 08:39

坚守品质解密一汽-大众如何让安全成为"时间的朋友" 2025-07-24 06:40

688301,又要被减持! 2025-07-24 04:37

科思创推出用于电动汽车电池的先进阻燃封装泡沫 2025-07-24 03:53

A股冲高回落沪指盘中突破3600点多主题轮动下关注低位布局机会 2025-07-24 01:58

金杯海狮2025款焕新上市,起售价6.98万元 2025-07-24 01:19

湖北枣阳:县域经济高质量发展助推全国百强再进位 2025-07-23 22:07

我爱我家为子公司提供2,800万担保 2025-07-23 19:26

东软终于成了一家“养老”公司 2025-07-23 17:31

广州汽车出口量显著提升上半年出口9万辆 2025-07-23 15:30

淘宝闪购辟谣:“内部专家访谈”纯属杜撰 2025-07-23 13:18

「快乐肥宅水」依然是最稳避风港? 2025-07-23 11:32

“政策+高温”双轮驱动煤炭板块估值修复行情有望开启 2025-07-23 07:00