首页 > 科技未来 > 内容

IEEE院士Ming C. Lin:为什么VR中的音频渲染模拟如此困难?

发布于:2024-06-18 编辑:匿名 来源:网络

虚拟现实 (VR) 技术的目的是提供身临其境的体验。

然而,到目前为止,不说无法模拟的嗅觉和触觉,就连在 VR 中能够体验到的音频也并不如视觉上的完美。

相信体验过一些VR设备的用户会发现VR中的音频失真度比较高。

这些问题在这一年里都得到了认识。

IEEE院士Ming C. Lin:为什么VR中的音频渲染模拟如此困难?

然而,为什么即使有解决方案,模拟真实的 VR 音频仍然如此困难呢?以下为北卡罗来纳大学教授学院主席、IEEE院士林明春在国际数字感知大会上的演讲节选。

为了便于理解,适当增减了一些内容:VR视频有所改进,声频仍处于80年代的水平。

袁昱博士刚才也提到了有跟踪和延迟的问题,还有一个问题是如何创造体验并捕捉它。

很多人都没有解决这个问题。

另外就是人与VR环境的交互。

目前,VR/AR领域已经开展的很多研究都是关于如何显示——视觉显示。

然而,触摸是一个非常具有挑战性的话题。

我们的皮肤可以传达感官,但如果你想知道如何采样,你可能需要运行数千次。

那么这个标准是什么呢?它可以由许多计算机进行预算。

我们尝试了不同的设备。

在这个研究领域,如果你是开发者或者研究人员,你会受到启发去研究这个领域,但是如果你是物理学家,你就会知道这是一个非常困难的问题。

今天我要详细讲的是,我们在VR中的音频实时渲染不是很好。

VR视频已经进步,但声频仍停留在20世纪80年代的水平。

在VR中,当位置不同、障碍物不同时,声音也不同,但目前我们还没有与声音进行交互。

在VR系统中体验某些内容时,有声和无声的体验有很大不同,这意味着沉浸感是否深浅。

想象一下,当我们处于交互式VR环境中时,我们如何使用录音来创建效果? ——声音控制在哪里?如果您在观看视频时没有听到声音,您将不知道发生了什么。

VR也是如此。

如果您听不到声音,您将不知道发生了什么。

为了保证AR环境中的视觉保真度,动态图像必须以每秒20-30帧的频率刷新。

单位时间的刷新率赋予图像一维时间信息。

为了实现声音和图像更好的信息融合,声音的三维方位信息必须与图像显示的三维信息融合,图像的刷新时间必须与图像显示的时间信息融合。

声音。

重要的是,我们人类想要感知这个声音,也就是我们在生理层面感受空间中的声音时,怎样才能得到实时的感觉呢?如果声音无法实时渲染,依靠外部配音,那么实际的声音轨迹只能是固定的2D效果,而不能让我们区分声音的来源和让声音像现实一样的材质,就是,当视频画面可以移动,但配音中的声源是固定的,这就大大降低了VR系统中的真实感。

另一方面,通过配音,不可能100%模拟每个场景中可以产生的声音。

例如,当木材、金属、流体等一系列复杂元素交叉碰撞时,模拟配音只能粗略地完成;并且,在虚拟空间中,声音的传播会穿过墙壁等一些障碍物,因此无法模拟配音。

所有这些造成的问题是高失真。

最后,如果每一帧的声音都需要外部模拟和匹配,那么数万帧的内容将需要庞大的配音工程。

更大的问题是,耳朵的形状实际上决定了每个人听到的声音都是不同的。

因此,我们要做的就是依靠算法根据人体生理状况,实时自动渲染生成场景中的声频。

它需要建模、建立音频数据库、建立算法。

难以捉摸的解决方案声音模拟的目的是使用计算机生成的声音来接近真实世界的声音。

从频域角度来看,两者的频谱分量相当接近。

现实世界中的任何声音都可以被视为具有独特幅度和相位的许多正弦波分量的混合。

声音的建模可以理解为声音的频谱分析。

我们先来了解一下声音传播的数学函数和几何方面是如何表示的:在模拟声音时,需要使用方程来计算声音传播的压力波,它是欧姆的四次方——这是一个非常高的频率,需要超级计算机要完成计算需要数倍升级的CPU。

例如,在教堂中,会使用不同的材料来模拟内部分散的声音,它们会有不同的吸收率。

因为材料的品质有本质的不同,不同的材料会有不同的效果。

模拟应该如何进行?以流体声音为例,目前的计划是用很多材质与一缸水碰撞,然后捕捉这些单点水滴的声音材质,并将其转换为代码。

那么在未来出现的新环境中,计算机可以利用算法将不同的材质合成为适合场景活动的声音。

其作用可以被认为是声音克隆。

有了这样的模拟能力,VR就可以让用户在水中进行互动。

否则,用户在VR中游泳根本没有感觉。

推而广之,不同的材料可以用来模拟不同的声音,而模拟万物也需要大量的材料。

又比如,当一颗珠子落在木板上时,根据珠子的大小、形状、速度和质量的不同,发出的声音也不同。

然后根据过去收集到的声源素材自动合成声音,比如各种木材的碰撞,铁块和木块的碰撞等。

因此,我们面临的困难有两个层面:第一个是基础建模的难度。

我们有大量的声源对象需要建模;二是基于模型生成声音的算法难度较大,需要复杂的逻辑和庞大的计算量。

数量。

目前我们能做的就是水流、滚珠轴承等少数型号。

另外,在模拟环境中,为了时刻观察运动的实体,计算机生成的图像对应的视点必须能够像电影镜头不断放大一样实时切换,实现声音的良好融合和图像一样,听点应跟随视点的变化。

在头部跟踪中,听音点的实时切换是非常有必要的。

当头部姿势发生变化时,为了保证生成的虚拟声源的位置保持静止,必须反向切换相应的头部脉冲响应函数。

不过,可以说,所有这些物理声音都可以通过模拟来一一生成。

我们可以利用这个技术来获得多渠道的交互,所以这是一个多模态的交互。

该技术的研究已经在进行中,将是未来突破的重点和难点。

IEEE院士Ming C. Lin:为什么VR中的音频渲染模拟如此困难?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 看新视野NO.06|金沙江周奇:科技投资者要坚持长期潜伏,善于把握技术成熟度

    看新视野NO.06|金沙江周奇:科技投资者要坚持长期潜伏,善于把握技术成熟度

    程序员理工科出身的男人,从华为金牌销量到领跑和参与在跨国并购中,周奇突破进入风险投资领域,成为“最挑剔的科技投资者”。 周奇的职业道路很好地贯彻了他的人生逻辑——“不变的是变化本身。 无所畏惧地寻求变化。 面对不确定性,在变化中寻找某些东西。 ”周奇所在的金沙

    06-18

  • 360金融上线360三大科技银行综合体已全部建立信用评分系统

    360金融上线360三大科技银行综合体已全部建立信用评分系统

    近日,金融正式上线个人信用评分。 该功能已在IOU APP上线。 这是蚂蚁芝麻信用分和腾讯信用分发展的第二步。 这是继微信支付积分之后,国内互联网+银行综合体建立的第三个信用积分体系。 6月5日,集团以12.8亿元收购天津津城银行股份有限公司(简称津城银行)30%股权,成为继

    06-17

  • CES Asia展示5G互联、人工智能、增强现实与虚拟现实、汽车技术等领域最新成果

    CES Asia展示5G互联、人工智能、增强现实与虚拟现实、汽车技术等领域最新成果

    上海--(美国商业资讯)--2019亚洲消费电子展于6月13日盛大开幕,观众络绎不绝来自世界各地的众多企业展示了众多前沿创新技术,包括5G、人工智能(AI)、增强现实/虚拟现实(AR/VR)、汽车技术等领域的颠覆性创新。 亚洲顶级科技盛会开幕当天,海信、华为、拜腾等企业高管发表主

    06-06

  • 唐智公测丨石头自洁扫拖机器人G10:养宠物家庭必备神器

    唐智公测丨石头自洁扫拖机器人G10:养宠物家庭必备神器

    本文由作者作为体验者@谭浩丹撰写,首发于唐智公测。 当你点击文章的那一刻,我就知道精致的猪猪男孩女孩进来了,欢迎。 前言:Stone公司一直在对机器人模块进行纵向研究。 其研发设计能力毋庸置疑,在其他扫地机器人中具有很强的竞争力。 而石头扫地自洁机器人G10,作为石头

    06-21

  • CES  2020 前瞻:苹果重返,微软索尼激战游戏主机,Intel AMD 放大招

    CES 2020 前瞻:苹果重返,微软索尼激战游戏主机,Intel AMD 放大招

    CES 2020前瞻:苹果回归,微软和索尼激烈争夺游戏机,英特尔和AMD扩大战略1月7日至1月10日,国际消费电子展(International Consumer Electronics Show)被誉为未来科技的风向标电子展(以下简称CES)将于拉斯维加斯开幕。 从公开信息来看,今年的CES可能会和往年一样精彩。

    06-18

  • 新能源新材料,投资什么

    新能源新材料,投资什么

    1月9日至11日,“创投大会”在西安召开。 本届大会以“走向现实、创新求强”为主题,邀请院士专家、投资机构、产业企业从宏观趋势、产业投资、企业发展等多个角度,呈现一场思想盛宴。 本次《 新能源新材料,向“新” 而行 》圆桌对话由理和资本创始合伙人、总裁唐立新主持。

    06-18

  • 四维资本完成第六期基金募集,最终募集资金总额达2.1亿美元

    四维资本完成第六期基金募集,最终募集资金总额达2.1亿美元

    四维资本私募股权投资基金-SEAVI Advent Private Equity(以下简称“四维资本”或“基金”) 4月30日,完成第六期基金(以下简称“新基金”)募集,并获得投资者认购承诺2.1亿美元。 该基金在今年6月结束的第一轮融资中筹集了1.25亿美元,投资者来自高净值个人、企业机构和家

    06-18

  • “认养一头牛”完成新一轮融资,德弘资本、KKR共同领投投融资

    “认养一头牛”完成新一轮融资,德弘资本、KKR共同领投投融资

    投资界(ID:pedaily)4月19日消息,认养一头牛乳业股份有限公司(以下简称认养一头牛)以“领养一头牛”)完成新一轮融资,本轮投资由德弘资本(DCP)和KKR联合领投。 投资资金将主要用于支持奶牛认养,加快现代化牧场和智能工厂建设,引进澳大利亚优质奶牛,升级产业链,为

    06-18

  • 愿景资本设立总规模8亿元的新基金

    愿景资本设立总规模8亿元的新基金

    据投资界4月28日消息,金风科技宣布,公司将担任愿景资本有限合伙人和基金管理人、普通合伙人共创资本管理有限公司(简称“愿景资本”)及其他有限合伙人中电投融和资产管理有限公司(简称“中电投融和资产”)、巴里贝瑞信托有限公司(简称“贝瑞信托”)、大家人寿保险股份

    06-18

  • NASA“重返月球计划”细节揭晓!阿姆斯特朗之后,人类何时才能迈出下一个“大步”?

    NASA“重返月球计划”细节揭晓!阿姆斯特朗之后,人类何时才能迈出下一个“大步”?

    美国宇航员阿姆斯特朗迈出的一小步,是人类迈出的一大步。 2011年7月20日,人类首次踏上月球。 50年后,美国国家层面宣布,请求美国国家航空航天局(NASA)实施重返月球计划。 它将在2019年运送两名宇航员(一名女性和一名男性)前往月球南极。 在月球上建立永久基地,使人类

    06-18

  • IDC:2021年云上数据量将超过传统数据中心 All in Cloud是趋势

    IDC:2021年云上数据量将超过传统数据中心 All in Cloud是趋势

    据知名研究机构IDC预测,全球公有云上存储的数据量将超过传统数据中心到2021年,传统数据中心对企业数据的控制将被云打破,企业将进入All in Cloud时代。 IDC预测,全球数据量正在迎来爆发,从2018年的33ZB增长到2018年的ZB。 推动这一增长的重要因素之一是云计算具有弹性扩

    06-18

  • 中升集团26日赴港上市 开汽车经销商先河

    中升集团26日赴港上市 开汽车经销商先河

    中升集团26日在香港上市,成为首家开设汽车经销商的汽车经销商。 股票26日挂牌,成为国内首家进入资本市场的汽车经销商。

    06-18