羽迹科技官网

首页 > 新闻中心 > 新闻详情

虚拟数字人是如何实现的

2022-04-13 09:58:10
虚拟数字人只有依靠当前电子显示设备的呈现才能被公众感知。它需要通过手机、电脑或智能大屏幕等硬件设备进行显示和显示。因此,数字人必须具备以下能力:1。依赖形象的能力,具有特定的外观、个性和个性特征;2.智能表达能力:语言、面部动作、表达和身体表达能力,识别外部环境,与人互动;因此,虚拟数字人的生产需要三个基本操作:图像生成、动画生成和语音生成。图像生成决定了虚拟人的外观、性别和其他基本外观;动画生成可以使虚拟人灵活、人性化;语音生成是让虚拟人说话、表达和互动。如果虚拟人有思想和高感知的互动能力,就需要更深入的人工智能技术。特别是在面对专业领域时,有必要具备特定的行业知识。
角色3D建模
形象生成最重要的是建模。常用的建模方法包括手工建模、扫描建模和人工智能建模。随着科学技术的发展,更高效的扫描建模和AL建模逐渐成为数字人建模的主流。方法是使用相机阵列扫描收集大量的面部和身体数据,然后通过算法处理获得最原始的三维人物模型数据。
如果建模完成后想移动模型,还需要一系列的绑定和驱动。骨骼和肌肉绑定决定了模型后续肢体运动和面部表情的自然性和流畅性。目前,骨骼绑定和混合变形绑定有两种主流方式。驱动分为真人实时驱动和智能自动驱动。通过影视工业的动作捕捉采集真人的肢体动作和面部表情等动态信息,然后将这些数据转移到数字人身上,这就是真人实时驱动。光学捕捉和惯性捕捉是一种常见的动态捕捉方法,但它们都需要佩戴动态捕捉设备,具有较高的使用门槛。
超现实虚拟数字人的面部表情捕捉也可以通过景深摄像头收集真人的面部3D点云,然后实时将面部动作和表情赋予到虚拟人身上。与捕捉表情相比,需要佩戴动态捕捉设备。驱动虚拟人只需要一部手机或GPU计算设备。驱动算法使操作过程更加简单方便。
动画模拟
绑定和驱动,还需要通过计算机渲染生成动画,渲染分为实时渲染和离线渲染,为了实现虚拟数字人的实时控制和实时交互,主要渲染引擎一直在努力和突破算法,提高算法的实时渲染效率,希望实时渲染图像质量、渲染速度、计算资源三个最佳解决方案。这部分的技术核心来自于游戏开发。
生成语音
形象和动作完成后,就是让虚拟人说话。虚拟数字人的语音可以使用合成语音或真人语音。通过人工智能技术和不断训练合成语音,会产生越来越类似真人语音的音调、节奏和抑扬顿挫,可以实时对应唇型。真人语音是直接用真人的声音或者声优来配音,也可以通过声音变声器将真实的声音转换成同一个声音。
以上可以完全实现高性能数字人的实现。然而,对于服务型数字人来说,仍然缺乏业务人工智能(人工智能)访问。专业服务需要专业的人工智能来回答。例如,虚拟教师需要相应的教学内容、课程知识和一些问题的储备来应对学生。企业的虚拟客户服务需要根据不同的行业和企业定制不同的人工智能,以满足企业客户服务数字人的应用需求。例如,银行客户服务不同于航空客户服务和快递物流客户服务。
简而言之,虚拟数字人是技术和艺术的完美结合。越来越多的虚拟数字人将逐渐进入社会的各个环节,通过不同的形象、个性和功能,为每个人习惯的工作和生活带来更新鲜、更温暖的体验。这得益于 虚拟数字人 技术的创新和推广,以及参与者不断尝试打破技术边界,促进技术整合的尝试。数字人也是一个更自由、更理想化的人类投影。
了解更多