在AIGC技术飞速发展的今天,AI正以前所未有的方式降低创意表达的门槛。过去,制作一部高质量的动画短片,往往意味着高昂的成本、漫长的周期和专业的团队,这让许多绝佳的创意止步于“不敢想”或“没条件”。如今,AI工具的普及正在打破这一壁垒,让“动画梦”变得触手可及。
作为一名交互设计师,本文从“探索-掌握-熟练”记录动画制作零基础小白通过灵境上手生成AI漫剧的心路历程,以此文记录下每一步的惊喜与踩坑作为设计日志输出,欢迎各位大佬指正~
一、创作契机
第十六届北京国际电影节游戏·动漫·电影单元与京东联合发起的“十二姬的次元宇宙”AI漫剧创作大赛,旨在探索前沿AI技术与虚拟偶像IP在内容创作中的深度融合。大赛以京东与12家头部硬件品牌共创的虚拟偶像女团“十二姬”为核心IP,邀请创作者运用AI工具,构建一个融合科技、潮流与品牌精神的次元故事宇宙。这不仅是一场创作竞赛,更是对硬件行业IP化、人格化叙事模式的一次先锋实践。
“十二姬”是硬件行业首个由京东与多品牌协同打造的虚拟偶像团体IP。这一模式打破了品牌孤岛,构建了一个共享的虚拟生态,其本身就具备“联盟”或“多元宇宙”的故事内核。每位成员自带鲜明的品牌基因(如电竞、性能、美学),为角色设定、世界观构建提供了现成的设定库。我计划借鉴其已有的角色设定和形象,全程应用内部工具灵境在“无限画布”中探索一站式生成AI漫剧这一新创作形式。
![]() |
![]() |
二、前期素材准备(JoyAgent)
关于剧本,我结合“JoyAgent”进行文本类创作,围绕“次元宇宙”主题,开发出兼具故事性、赛博感与次元特色的原创漫剧作品。
1、首先让AI提炼出每个角色的特性和话题性,深入挖掘角色的背景设定:
| 品牌/角色 | 核心特性提炼 | 可挖掘的故事点(用于微电影) |
|---|---|---|
| 红魔姬 | 聪慧可靠,傲娇防御。拥有超级AI混沌演算出的情感,初始身份是带来快乐的偶像,实则有拯救人类的潜力。 | 成长弧光核心。从“为快乐而存在”到“为责任而战”。她的傲娇是保护色,在危机中逐渐卸下,展现内在的可靠与领导力。口头禅“我将与你共同面对未来”从口号变为行动誓言。 |
| 雕妹 | 热情憨憨,努力感染。作为早期虚拟小编,接地气,有亲和力,用热情感染他人。 | 团队粘合剂。在危机中,她可能用最“不科技”的方式(如真诚的鼓励、分享零食)稳定团队情绪,体现“超凡能量”的人文价值。吃货属性可制造轻松桥段。 |
| 瑷珈 | 时空旅者,歌声武器。为寻找重要事物穿梭时空,以歌声散播爱与勇气。 | 线索提供者/精神鼓舞者。她的时空知识可能提供危机线索;歌声成为在黑暗时刻凝聚团队、唤醒希望的关键“武器”。 |
| 柒小希 | 元气领袖,责任心强。赛博城来的元气少女,有强烈的责任感和领袖气质。 | 战术执行者/行动派。可能负责具体的危机应对方案,她的汉元素与机甲风融合服饰可体现传统与科技的结合,象征守护的多元性。 |
| 魔龙姬 | 技术探险家,好奇心强。擅长机械,热爱探险与游戏。 | 技术攻坚担当。负责破解技术难题、组装装备或利用机械知识找到系统漏洞。她的探险精神驱动团队寻找 unconventional 的解决方案。 |
| 星曜娘(LUNA) | 优雅守护者,性能优化。专司显卡性能与光效,坚韧而慈悲。 | 系统防御核心。在对抗网络攻击或性能崩溃的危机中,她直接负责稳定“战场”(如游戏服务器、渲染农场)的帧率与视觉稳定,是技术层面的“守护神”。 |
| 爱攻姬 | 果敢好战,追求极致。“生而好战,只为玩家”,象征胜利。 | 攻坚先锋。在需要正面突破、强力对抗的环节(如对抗恶意程序、进行性能极限压测)中担当主力,体现“胜战不息”的精神。 |
| 极光姬 | 共情创作者,毒舌 perfectionist。温柔但毒舌,致力于修复视觉缺陷。 | 问题诊断与修复专家。危机可能表现为严重的视觉污染、色彩失真或创作环境崩溃。她负责精准定位并“修复”这些“视觉污点”,保护创意生态。 |
| RO姬 | 战斗公主,带来希望。从阿苏斯星来到地球的救世主。 | 战力与希望象征。她的背景故事与当前危机形成互文,她的出现能极大提振团队士气,并可能提供更高维度的战略视角或力量。 |
| 天选姬 | 科技学霸,百变达人。拥有强大意识与丰富知识库,穿搭达人。 | 情报分析与伪装大师。利用其博闻强识的知识破解谜题、分析数据;利用“百万衣橱”进行身份伪装或环境适应,完成关键潜入或沟通任务。 |
| SANC-koko | 冷峻指挥官,精准掌控。象征精准、科技与掌控力。 | 战术指挥与精准执行。在需要高度纪律性、精准操作的环节(如同步多线攻击、进行精密系统操作)中担任临时指挥官,体现冷静与精准。 |
接下来在十二姬中确定核心组合,从中选择1-2对最具化学反应的CP(如Ro姬+KoKo)作为首支漫剧主角。
2、细化分镜脚本,针对选定的组合撰写更详细的分镜头脚本:
| 镜号 | 场景 | 画面描述 | 台词/音效 | 时长 |
|---|---|---|---|---|
| 1 | 现实世界-虚拟舞台 | 巨大的全息投影与激光矩阵交织,将夜空染成一片绚烂的数码海洋。台下是数万名挥舞着荧光棒的粉丝,声浪几乎要掀翻屋顶。 | 霓虹城市背景,全息投影舞台,烟雾,欢呼粉丝剪影。 | 5秒 |
| 2 | 虚拟后台-指挥中心 | 巨大的全息星图在黑暗中流转,数据流如瀑布般倾泻。空气中弥漫着低沉的嗡鸣。koko正在部署关键战术。环境充满全息投影与数据流,凸显其科技感与掌控力 | koko(冷静而清晰,声音通过扩音器回荡):“所有单位注意,侦测到‘暗流’异常波动,不符合常规巡逻模式。” | 3秒 |
| 3 | 虚拟后台-指挥中心 | koko靠近一块悬浮的战术面板,手指快速滑动,放大一个星系的细节。她的眼神锐利如刀,紧盯着面板上跳动的数据。 | koko(低声自语,带着分析的冷静):“这不是骚扰。是试探。他们在寻找防御体系的‘缝隙’。” | 4秒 |
| 4 | 虚拟后台-数据空间 | LUNA悬浮在由流动代码构成的数据空间中,她的圣剑光芒忽明忽暗,周围的数据流出现大量噪点和阻塞。 | 布满了尖锐的红色噪点、断裂的代码块和停滞的黑色空洞 | 5秒 |
| 5 | 危机现场-虚拟舞台 | 舞台已被“颠倒世界”触须严重侵蚀,地面龟裂,全息投影扭曲,紫色负能量弥漫。背景是仍在闪烁的故障屏幕和巨大的裂缝。 | 她周身环绕的活力屏障(粉蓝交织的能量场)明暗闪烁,表面不断出现蛛网般的裂痕,并发出不堪重负的嗡鸣声。 | 3秒 |
| 6 | 冲突与对峙 | 屏障上一道裂痕被怪物的利爪狠狠撕开,紫色的负能量瞬间涌入,又迅速被RO姬用另一股能量强行压制回去,爆出一团火花。 | “数据污染源核心...坐标锁定...演唱会现场!” | 5秒 |
| 7 | 合作尝试 | 她一边战斗,一边焦急地看向身旁的KOKO,呼吸急促但眼神依然坚定。 | RO姬(对KOKO喊道,声音带着喘息但充满力量): “屏障撑不了多久!需要更强的攻击来直接斩断它们的能量源” | 4秒 |
| 8 | 成功与转折 | 怪物被击溃,化为光点消散。虚拟世界恢复稳定。红魔姬惊讶地看着自己的双手,又看向Koko。Koko微微点头,递给她一个数据芯片。 | koko(声音斩钉截铁,充满力量与风范):“他们想掐住我们的咽喉。但……他们算错了一点。我的弯刀,会亲自斩断他们的指挥链。” | 5秒 |
三、生成角色三视图(Banana2-Flash)
根据官方角色设定图拓展出角色三视图,丰满人物设定的细节,如角色衣物背面的穿插,武器的结构等,便于在关键场景及多角度生成视频时保持人物细节一致性。这里应用了无限画布的“参考生图”的功能,图片输入的是两个角度的官方形象图,文字prompt:生成角色三视图,注意面部、品牌logo、衣服细节。模型采用:香蕉2-Flash,16:9,4K,2张。
![]() |
|---|
| Tips:这里需要把图片清晰度选到最高,确保后续以图生视频的清晰度更高、识别性更强。 |
![]() | ![]() |
![]() | ![]() |
四、参考生图-分镜概念(Banana2-Flash)
在生成三视图的基础上,将角色图、三视图、文本共同连线,继续使用“参考生图”的模式,可以在文本prompt这里描述画面构图、镜头、人物姿势、特效等细节。
![]() |
|---|
| Tips:由于三视图生成选择了4K清晰度,所以图片较大(超20MB),图片过大会导致解析慢、生成失败等问题,所以建议下载原图压缩后再上传,成功率会更高。 |
![]() |
|---|
| Tips:这里我习惯于把每个场景的不同分镜一一排列,这样就可以预览故事的连贯性,分镜和分镜之间是否需要再补充一个镜头,一目了然。 |
五、图生视频-动态片段(Seedance1.5/2.0)
当我们有了定帧,接下来就是看图说话的部分了,无限画布中主要有三种生视频的方式:文生视频、图生视频、参考生视频
下面来着重拆解一下这三种功能最适合什么情况下使用,大家可以按需选择:
| 文生视频 | 图生视频 |
|---|---|
| 【功能】左侧填入文本,右侧生成视频 【适用】空镜、运镜、大场面 | 【功能】分别上传首帧尾帧,首尾相连生成视频 【适用】同一主体的不同场景切换 |
![]() | ![]() |
| Tips:文本prompt可以尝试在小红书上搜一些比较专业的镜头参数,运镜走位,创意构图,可以有一些意想不到的大片效果~ | Tips:这里要在模型设置里打开“同步音频”,这样在提示词里就可以拟定角色的口播和台词,也可以分别描述镜头一和镜头二的内容及动作,生成的视频就会更贴切你的需求。 |
| 参考生视频(图片参考) | 参考生视频(视频参考) |
|---|---|
| 【功能】左侧上传图片,右侧生成视频 【适用】特定场景特定角色的不同动态、慢动作 | 【功能】上传视频/生成视频后,右侧加号添加参考 【适用】前一镜头的延续、上传参考视频进行拆解 |
![]() | ![]() |
| Tips:此功能适合单帧的镜头拉近进行人物特写或者打斗场景前的渲染慢动作镜头。 | Tips:如果分镜没有提前设想好,可以用此功能直接AI延续故事线,增加一些AI概率剧情。 |
六、视频剪辑合成
在“无限画布”中生成的视频可以直接对当前卡断进行修剪、提取关键帧、分割、合成、导出等操作,如需增加台词和更多画面效果,可以把视频导入到剪辑软件中,我在这里使用了剪映来完成大批量的素材拼凑和后期的制作。
![]() |
| Tips:在视频编辑这里可以定位到局部的关键帧,再根据关键帧继续参考生视频/生图,同理就可以提取生成后视频的尾帧作为下一个视频的首帧,做首尾相连,形成连贯的故事剧情。 |
七、漫剧效果
表面是降临地球、圈粉无数的顶流虚拟偶像,真实身份是刚从邪恶AI手中救下阿苏斯星的百战战斗公主——RO姬...邪恶AI追兵尾随而至,城市网络全线告急,她的演唱会现场竟成了敌人攻破地球防线的后门...戴着偶像皇冠的战斗公主,能赢下这场生死对决?
👉 点击查看完整剧情,解锁RO姬不为人知的战斗秘辛!

八、写在最后
每当我打开电脑,面对空白的项目文件夹和各色AI工具时心情都很焦虑,每个工具都像一座孤岛,我需要分别学习、拼接、调试...直到我发现了灵境平台的 “无限画布” ,它将角色设计、分镜绘制、视频渲染到视频剪辑的全功能整合在一个空间里,很大程度上解决了“一站式创作” 的痛点。
借助参与“北影AIGC漫剧大赛”的契机,我使用灵境的“无限画布”完整探索了一种截然不同的AI动画制作路径,希望通过展示从0到1的完整历程,破除大家对AI创作的神秘感和畏惧感,带动大家一起“Enjoy AI”——享受技术带来的创作自由,勇敢地将天马行空的创意,以更低的成本、更高的效率付诸实践。
让我们一起,拥抱这个AI平权的时代,将“不敢想”变为“了不起的成果”。




















