美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库

2023-10-11 09:37:00 来源:光明网

10月9日,美图公司在厦门举办15周年生日会并发布自研AI视觉大模型MiracleVision(奇想智能)3.0版本(以下简称“MiracleVision3.0”)。

美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库

活动现场,美图公司创始人、董事长兼首席执行官吴欣鸿宣布MiracleVision3.0将全面应用于美图旗下影像与设计产品,助力电商、广告、游戏、动漫、影视五大行业。

美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库

美图公司创始人、董事长兼首席执行官吴欣鸿

MiracleVision的“百日进化史”:奇思妙想与智能创作

据吴欣鸿介绍,三个月前MiracleVision1.0绘画水平还停留在初级阶段,如今3.0版本已经能描绘出真实细腻的画面细节。

在活动现场,吴欣鸿将自己15岁的绘画作品与面世100天的MiracleVision3.0生成作品进行对比。他认为,训练AI与人类学画有很多共通之处,通过充分学习不同的绘画风格和技巧,AI能创作出具有独特性的原创作品。

吴欣鸿介绍,MiracleVision3.0主打“奇思妙想”和“智能创作”,通过“提示词智能联想”“提示词精准控制”等功能,可以让用户的各种奇思妙想实现所想即所得。“这些功能使得AI更可控。”吴欣鸿说。

同时,吴欣鸿强调,短期内AI并不会替代人类的创造性工作,而是为创作者赋能,实现降本增效。

美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库

MiracleVision助力五大行业:电商、广告、游戏、动漫、影视

在吴欣鸿看来,AI视觉大模型带来的不仅仅是更好的视觉呈现,还有对工作流的效率提升。但目前,大模型与工作流的结合仍在探索阶段,抓住应用场景的核心需求更为重要。

吴欣鸿介绍,MiracleVision3.0将落地电商、广告、游戏、动漫、影视五大行业,希望能助力这五大行业工作流提效。

以电商行业为例,商家通过MiracleVision3.0,可以实现从涂鸦生成线稿、线稿上色、商品图、模特试穿图,再到电商物料输出的全过程,极大提高生产效率、降低成本。

吴欣鸿表示,MiracleVision3.0将充分发挥“奇思妙想、智能创作”的能力,持续助力更多的设计场景。

美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库

AI视觉大模型本质:无穷无尽的视觉创意库

活动现场,吴欣鸿还分享了对于AI视觉大模型的思考:“AI视觉大模型的本质,是无穷无尽的视觉创意库。应用层相当于内容提取器,根据用户的需求,从这个巨大的创意库中提取所需要的内容,让用户在特定场景中使用。”

目前,国内有很多团队在研发视觉大模型,但能将视觉大模型与生产环节结合的企业数量相对较少。吴欣鸿认为,大模型真正在生产端普及使用,亟待解决的三大问题分别是:垂直领域极致效果、工作流整合、变现能力。

吴欣鸿介绍,美图公司将视觉的大模型应用普及将分为三个阶段:探索期、高速发展期、成熟期。

美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库

其中,2024年之前是探索期,视觉大模型厂商在这一阶段进行不断探索,效果勉强及格,视觉大模型在工作流中支持单任务的提效,验证场景可行性;2024—2025年将进入高速发展期,效果逐步精进,有明确的场景,带来工作流的升级;2026—2030年进入成熟期,视觉大模型生成效果将会非常出色,凡是设计与创意,视觉大模型都是标配。

吴欣鸿认为,视觉大模型将助力千万设计场景,引领美学的升级与社会经济增长。

美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库

值得一提的是,美图公司公布了6月19日发布的影像生产力工具最新数据:AI视觉创作工具“WHEE”的优质AI效果生成数已超过550万张;AI口播视频工具“开拍”月活跃用户数已突破35万;桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者;主打AI商业设计的“美图设计室”正助力近百万中小电商卖家实现降本增效;美图AI助手“RoboNeo”每天帮助近万名用户自动修图,相比传统修图,效率提升35%;AI数字人生成工具“DreamAvatar”于8月底上线并主打“AI演员”数字人服务。

美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库

图片由MiracleVision3.0生成

关键词:新闻现场,1记者,专注的眼神,城市街道,高清分辨率,科技感,现代,自然光,金属质地

提及未来,吴欣鸿表示:“美图的初心是让科技与艺术美好交汇,我们会以最好的状态投入到下一个15年。”(记者 林佳欣)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。