在暖色灯光中,一个复古行李箱缓缓打开,露出灰白色的运动鞋,光影在鞋面上划过,镜头拉近,麂皮质地的纹理清晰可见。画面一转,鞋子旋转起来,灯光由暗转亮,明暗交接在鞋跟处形成一个慢镜头的色彩对比,一边明亮、一边典雅。
这个20s的商品展示视频,角度丰富、色彩讲究、镜头多变,但并非来自摄影机实拍,而是由AI通过几张照片生成。
短视频在电商营销领域的重要性毋容置疑,而AI将代替人工将短视频生产效率大幅提高,“AIGC让我们一天能生产10万条短视频。”时代涌现联合创始人茅旭超在亿邦峰会上表示。
这就是大模型带来的新型生产力。
从技术发展角度看,AI视频生成经历了图像拼接生成、GAN/VAE生成、自回归和扩散模型三个发展阶段,目前已经应用于影视预告片、广告、虚拟场景/角色/特效、老电影/珍贵影像资料修复等领域。
随着短视频工业化能力的大幅提升,广告营销公司、MCN机构、影视公司、游戏公司都在迎来新变革。
01
短视频自动生成,成本1/10
“国内对短视频的需求强烈,主要来自电商平台的流量扶持。”极睿科技CEO武彬分析。
极睿科技从事电商营销6年,通过AI自动生成海量商品营销内容。武彬注意到,短视频需求的爆发,始于2022年淘宝、京东、唯品会等电商平台的全面视频化。比如作为淘系流量新入口的淘宝逛逛,2021年上线,2022年淘宝逛逛被列为和淘宝直播平级的部门。
有官方扶持意味着大流量和高投入产出比,商家只需要通过制作和发布视频就可以实现流量增长。“因为平台有流量扶持,所以品牌的每一个SKU都有了被视频化的必要。”武彬指出。
只不过在2022年,短视频的制作能力尚且跟不上各个平台爆发的短视频需求。
传统的人工生产视频成本100-500元/条,拍一套服装展示的短视频需要先找模特、找场景,然后美工P图、裁图、做主图、做详情页,第三步剪辑短视频,第四步运营,做商品上下架管理,第五步多平台种草,在淘宝、京东、抖音、小红书等平台发布,第六步根据种草情况进行调整。
图片来源:极睿科技
与手工作坊相比,大模型带来了工业化的视频生产方式。比如,时代涌现提供的超麦视频,可以将品牌的所有产品图全部视频化,“我们可以根据同一个详情页,生成无数视频。因为每一次AI调用的镜头和生成视频是不一样的,在这样的服务框架下,我们可以帮品牌生成无限量的基础视频,在公域中获得流量。”茅旭超介绍。
大模型将短视频的制作成本降低至原本的1/5-1/10。“之前我一年要做1万条视频,成本100多万,现在可能20万搞定。而且这个需求没有边界,这个行业里的这些商家都需要,只是以前做不到而已。”武彬指出。
大模型这一新的生产力,也在改变着品牌的内容营销方法和广告公司、MCN机构的生存方式。
茅旭超注意到,过去品牌的内容营销是倒三角形:
针对1%-5%的爆品,内容高预算高质量,广告公司或者4A创意机构制作;
针对10%-15%的核心款,内容低预算高质量,影棚或制作公司生产;
针对70%-80%的长尾款,内容低预算低质量,电商代运营或内部职能部门制作。
现在有了AIGC,品牌可以针对不同级别的产品,制作不同的AI内容:
针对1%-5%的爆品,AI创意脚本+高精度3D模型,合成高质量3D创意视频。
针对10%-15%的核心款,提供AI智能混剪、AI虚拟人测评/讲解视频、AI商品(3D)表达视频。
针对70%-80%的长尾款,通过AI快速让品牌的所有产品图动起来——AI商品2D表达视频、AI淘宝详情页头图视频、AI淘宝微详情视频、AI旁白混剪视频、AI模特换装效果图等。
国内还流行基于语义识别和视觉识别,智能抓取直播讲解片段并混剪分发的直播切片。比如极睿科技推出的iCut,自动识别直播过程中的卖点片段,无需剪辑就可以一边直播一边实时获得海量短视频素材,帮助直播卖家通过短视频引流获客和持续成交。
图片来源:极睿科技
时代涌现则通过自研大模型FancyGPT,自动生成商品视频——只要输入一个商品的链接地址,FancyGPT会自动解析生成代码,在时代涌现的视频渲染软件中自动完成视频制作。“只要品牌把商品店铺ID给到我们,我们可以自动解析品牌电商店铺里面所有素材的信息、图片、视频、文本描述。通过全自动方式调用素材,重新做整合,自动生成视频。”茅旭超介绍。
短视频引流效果十分惊人。某知名羽绒服抖音直播间超90%的流量来自直播切片和图文视频的引流。“在我们合作的一些店铺中,短视频带来的流量一度占到了全店流量的98%。品牌其他地方的流量没有下降,这就是平台对于短视频的扶持,导致短视频流量增长非常快。”武彬指出。
2023年,极睿科技有望实现四倍增长。4月极睿科技的iCut demo版上线,受到客户的欢迎,“那个时候智能化程度还没那么高,还需要一些人工来配合,但引流效果确实不错。之后就客户就开始大量采买视频,真正起量在七八月份。”武彬记得。
时代涌现的营收也预计翻三到四倍,他们还将业务从线上营销扩展到线下门店,将门店海报替换为大屏幕,在线下展示优质短视频内容。
02
大模型文生视频,群雄竞起
不久前,有人将大热的《奥本海默》和《芭比》合在一起做成一部预告片,用ChatGPT写脚本,Midjourney生成图像,Runway Gen-2生成视频,粉色的摩登女郎和铁灰色的工程机械融合得巧妙,情节新颖,画面真实。
图片来源:Twitter
自从2023年4月Runway上线新产品GEN-2,可以用文字、图像或视频片段生成新视频,视频创作的玩法就五花八门。
一段话可以生成一个短视频。
图片来源:Twitter
一张图也可以生成一个短视频。
图片来源:Twitter
在本轮AI浪潮中,文生文、文生图、文生视频/图生视频一直并行发展,ChatGPT代表了文字生成的率先突破,Midjourney将文生图推到人人可用,视频是多帧图像的组合,文生视频在文生图的基础上增加了时间维度,需要更多算力资源、理解能力和生成能力。
目前文生视频底层技术仍在优化,最优模型尚未出现,文生视频仍在探索如何实现高分辨率视频生成、超长文本的视频生成和无限时长的连贯视频生成。
谷歌在视频质量和视频长度上分别发力,推出Imagen-Video和Phenaki两款产品抢占市场;Meta发布Make-a-Video视频生成模型,让细节更逼真;OpenAI发布的GPT-4更是增加了多模态能力,打通文字、图片、视频、3D之间的转换能力;微软在GitHub上开源NUWA系列,发布NUWA- XL超长视频生成模型。
阿里达摩院上线的文生视频模型“Zeroscope”,试图与GEN-2正面竞争,阿里云还发布了一个数字人视频生成工具Live Portait,可以通过上传一张照片和一段文本,生成一段开口说话的数字人视频;文心一言通过视频插件Text2Video,实现文心一言编写脚本,插件生成视频;腾讯智影也让数字人可以开口说话。
AI视频生成在影视行业中已经得到应用。Runway参与了《瞬息全宇宙》的特效制作,仅靠五人就完成了电影后期制作,名场面 “热狗手”还获得好评。
图片来源:瞬息全宇宙
《流浪地球》导演郭帆也公开表示,“《流浪地球》第三季如果拍摄的话,现场可能至少一半以上的人会减少掉。人工智能对我们来说既是挑战,也是机遇,可能是我们弯道超车好莱坞的机会。”
03
营销技术变革,谁先吃到红利
影视行业对时长、动作连贯性和画面逼真度要求更高,而视频营销对分辨率和连贯性的要求较低,更重视制作成本与引流效果。
同时,大模型应用层的创新也有窗口期,短视频营销正在直面大厂竞争。2023年上半年,大厂相继在研发各自的通用模型,应用层厂商率先利用AIGC取得抢跑优势。下半年,大厂大模型整装待发,大厂相继推出适用于各自平台的AIGC营销产品,比如阿里妈妈的“万相实验室”,京东的“云鼎权益”。
时代涌现创始人 William Li(花名:空界)曾是天猫奢品Luxury Pavilion初代负责人,时代涌现从成立之初便瞄准聚焦营销领域,只做基础物料生产。
据了解,时代涌现在技术上推出自研大模型FancyGPT——基于LLaMA模型调参600亿的大模型,可自动完成营销视频制作;在运营上实现多平台内容的管理和生产,可以把各平台的直播素材混剪成视频,一键投放至线下大屏。“我们更多解决的不只是一个平台,而是整个品牌的资产性问题。”时代涌现CRO默羽强调。
除了电商营销,时代涌现还注意到4A公司和线下营销的生意。“电商营销50亿规模,广告150亿规模,线下营销150亿规模,这350亿规模的市场,足够我们深耕。”默羽介绍。
据武彬介绍,极睿科技成立了一家MCN机构,从团队抽调几个人做兼职,在淘宝精选联盟选择高佣金的商品连接,通过自研工具生成短视频并在淘宝平台分发。上线第一天成交100多万元,此后每天稳定在数十万至100万左右。8月10号注册到8月底,该MCN公司累计成交额已经达到900多万元。
当下的视频模型还处于发展初期,技术短板仍然不少,比如计算成本高昂——一个短视频每秒包含大约30帧图像,单个视频片段有数百数千帧,为确保每一帧之间空间和时间的一致性,需要大量的计算资源。
再比如,复杂信息难以处理——视频带有视觉动态信息,添加不同帧之间的时间信息后,对视频内容进行建模变得非常具有挑战性。
杰克韦尔奇曾提出过一个“10倍理论”:当新技术产生的效果能够10倍于原有技术,或者将成本降低至原有的1/10,新技术就能打穿旧有体系。
AI视频生成在内容营销领域已经将成本降低至1/10,同时将生产效率提升10倍。新技术的穿透力正在改变营销公司、广告公司、MCN机构的生存方式,这种改变还在继续。