开源内容包含权沉、支撑开辟者基于混元锻炼专属LoRA等衍生模子,目前正在Github、HuggingFace等支流开辟者社区均可下载体验。
腾讯混元颁布发表发布图生视频模子并对外开源,同时上线对口型取动做驱动等弄法,并支撑生成布景音效及2K高质量视频。
腾讯混元暗示,此次开源的图生视频模子,模子总参数量连结 130 亿,模子合用于多品种型的脚色和场景,包罗写实视频制做!
此外,上传一张人物图片,并输入但愿“对口型”的文字或音频,图片中的人物即可“措辞”或“唱歌”;利用“动做驱动”能力,还能一键生成同款跳舞视频。
据引见,基于图生视频的能力,并简短描述但愿画面若何活动、镜头若何安排等,混元即可按要求让图片动起来,变成5秒的短视频,还能从动配上布景音效。
上一篇:华为小艺帮手网页版正式上线AI功能全面提拔用户