应用思考-教育技术论坛

标题: EMO:一张照片+音频即可生成会说话唱歌的视频 [打印本页]

作者: etthink    时间: 2024-3-1 16:08
标题: EMO:一张照片+音频即可生成会说话唱歌的视频
EMO:一张照片+音频即可生成会说话唱歌的视频
EMO Emote Portrait Alive
阿里的一项人工智能服务
EMO 基于扩散模型,只需要提供图像和音频就可以生成富有表现力的肖像视频。从公布的视频来看,EMO 在生成肖像的动作、口型及表情等方面均表现不俗,展现了与 Sora 一样丰富的“可玩性”,能完成许多具有想象力和创造性的各类视频。
EMO 驱动的肖像不仅可以唱歌、口语对白,甚至还能为你秀一段快嘴说唱。
项目地址:https://humanaigc.github.io/emote-portrait-alive/







欢迎光临 应用思考-教育技术论坛 (http://etthink.com/) Powered by Discuz! X3.4