丹凤千字科普:学唱歌的app哪个好(详细资料介绍)

极目新闻记者报道:只需一段音频和一张照片,就能创造出让人惊叹的虚拟表演——人物开口唱歌、说话,一切成为可能!让奥黛丽赫本演绎《上春山》,让陶俑仕女说英文RAP,或是让爱因斯坦讲述中文段子,这些曾经只存在于想象中的情景,如今已经变成现实!
最近,名为EMO的AI模型因阿里通义实验室的一篇论文而声名大噪,其技术实现的创新也引起了广泛关注。好消息是,4月25日,EMO终于在通义APP上线,对所有用户免费开放。
在通义APP的“全民舞台”频道中,EMO的产品页面展示了其强大的“全民唱演”功能。用户只需选择歌曲、热梗、表情包等模板之一,上传自己的肖像照片,EMO便能迅速合成一段生动的视频。
极目新闻记者亲身体验,随机生成了一段会说话的AI视频,以及一个流畅的动态小视频,最长可达1分30秒左右。令人惊奇的是,视频中的人物表情、语音、语速等都能与上传的音频完美对应,仿佛真的是人物在演唱和讲话。
据了解,目前首批上线了80多个EMO模板,涵盖了热门歌曲如《上春山》、《野狼disco》等,以及网络热梗如“钵钵鸡”、“回手掏”等。尽管目前暂不支持自定义音频,但用户仍可通过选择APP预置的音频来生成个性化的视频。
EMO是通义实验室研发的AI模型,其背后的肖像说话(Talking Head)技术是当前大热的AIGC领域的一项创新。与传统的需要针对人脸、头部或身体进行3D建模的Talking Head技术不同,EMO采用了弱控制设计,无需建模即可驱动肖像开口说话。这一技术不仅降低了视频生成的成本,还大大提高了视频的质量。EMO通过学习编码人类表达情绪的能力,能够将音频内容与人物的表情、嘴型相匹配,并反映音频的语气特征和情绪色彩,让微表情也栩栩如生。
自今年2月底通义实验室公布相关论文以来,EMO已经成为继SORA之后最受关注的AI模型之一。现在,通义APP让所有人都能免费体验这一前沿模型的创造力。未来,EMO技术有望在数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景中得到广泛应用。
更多精彩资讯,请下载“极目新闻”客户端。未经授权请勿转载。欢迎提供新闻线索,一经采纳即付报酬。24小料热线:。
