主题
FramePack 是一种下一帧(下一帧部分)预测神经网络结构,可以逐步生成视频。其核心在于通过固定长度的时域上下文压缩,将传统视频扩散模型的显存需求从线性增长变为恒定,使消费级硬件(如 6GB 显存的笔记本 GPU)也能生成长达 1 分钟的高清视频。FramePack 支持更大批量大小(Batch Size)训练的特性,是其区别于传统视频生成模型的核心优势之一,这一特性使其能像图像扩散模型(如 Stable Diffusion)一样高效利用 GPU 显存,显著提升训练效率与模型性能。