文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

快手出席首届中国数字人大会:多模态数字人降低内容生产门槛 实现提效经营

2024-11-29 18:15

关注

万鹏飞表示,经过多年的技术研发,快手已构建起了完备的多模态数字人解决方案。具体而言,多模态数字人按照不同的输入形式,可分为传感器、文本/音频、视频、多模态综合四大驱动形式。其中,具备完整多模态输入输出能力的多模态数字人,相较而言效果上限更高,技术难度更大。

在此背景下,快手基于自研数字人采集建模、绑定、动捕驱动、大模型生成互动、交互渲染等技术,全面打造多模态数字人解决方案。他介绍称,数字人可应用于商业化、本地生活、电商、招聘等多元场景,主要分为身份型和服务型两种类型。

以快手官方虚拟主播“关小芳”为例,作为身份型数字人的典型应用,其打通了ASR、VLM、LLM等多个自研大模型能力,具备多模态感知、决策、生成能力,互动延时低于2秒且支持用户打断。卓越的性能表现和极低的推理时延使其广泛应用于快手财报解读等多种场景,并在快手平台吸引了超200万粉丝的关注。

同时,针对服务型数字人,快手打造了“快手智播”生成式数字人平台,支持超1000种数字人形象,用户只需提供3分钟视频素材,即可完成个性化数字人的生成。

万鹏飞介绍,除形象生成外,该平台融合了语音、图像及大模型等多种人工智能技术,具备直播/离线视频制作、配套脚本生成、素材管理等能力,打造低门槛、智能化的内容生产体验。一方面,平台所生成的数字人可帮助商家在快手实现云端实时驱动快速开播,打造7×24小时日不落直播间,增强用户观看体验;另一方面,对比真人主播,快手生成式数字人每月投入成本不足真人的20%,且支持万路以上直播间并发。目前,“快手智播”平台服务商家数已破万,数字人直播及短视频日均消耗规模超2000万。

随着AI大模型时代的来临,AIGC正在推动整个行业迈向更加高效、有创意的新纪元。万鹏飞表示,接下来,快手也将大力推动技术创新与产业发展,让多模态数字人更精美、更有智商和情商,为更多数字人应用场景带来更大的业务收益,也为人们的生活带来更多的便利。

应对AI技术迅猛发展的趋势及业界对前沿技术的迫切需求,聚焦新一代大模型的关键技术研发,未来,快手也将进一步夯实基座模型硬实力,持续坚持技术创新,为推动我国数字人产业的技术进步和创新发展贡献更大的力量。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯