Imagen Video,是基于文本條件生成視頻的模型。給定相應(yīng)的文本提示,在基于“視頻生成模型”和“交錯(cuò)時(shí)空視頻流超分辨率模型”,Imagen Video能夠生成高清晰度的視頻。
把之前的文本圖像生成的擴(kuò)散模型,遷移到文本視頻生成模型上。最后使用分類器進(jìn)行指導(dǎo),以實(shí)現(xiàn)快速和高質(zhì)量的采樣。在實(shí)驗(yàn)中發(fā)現(xiàn),Imagen Video僅能夠生成高保真視頻,而且具有高度的可控性和世界知識(shí),包括能夠生成各種藝術(shù)風(fēng)格的視頻,3D結(jié)構(gòu)的視頻,或者是生成特定的動(dòng)畫。
收起