一个多镜头长视频故事生成的工具:StoryMem,给分镜脚本,自动产出1分多钟、多镜头、连贯、角色一致的叙事视频
它把“记忆机制”接入Wan2.2视频扩散模型,先用 T2V生成首镜作为初始记忆
之后每镜用M2V LoRA逐镜生成,并在生成后自动提取关键帧更新记忆,来保证角色/场景跨镜一致
对于营销/广告、影视剧组等场景,可以快速生成动态分镜,做进行A/B测试用
github:https://github.com/Kevin-thu/StoryMem
daiyu.mp4
princess.mp4