首页>>人工智能->人工智能怎么和vr结合

人工智能怎么和vr结合

时间:2023-12-01 本站 点击:0

导读:今天首席CTO笔记来给各位分享关于人工智能怎么和vr结合的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

1、为什么沉浸式VR技术需要人工智能的助攻2、ai转换vr3、AR的核心技术,及与人工智能之间的关系4、人工智能与VR是何关系 VR是否需要AI支撑

为什么沉浸式VR技术需要人工智能的助攻

要实现真正的沉浸式的虚拟现实,需要视觉、听觉、触觉、嗅觉、味觉五位一体。目前,要实现触觉、嗅觉和味觉的远程分享与重现还具有很大的技术难度。但值得庆幸的是,视觉和听觉占据了70~80%的感知途径。就听觉层面上来说,3D立体环绕声可以高质量地复现环境声音,而且该技术已经相对成熟。目前,最大的难题是要在视觉上满足“挑剔”的双眼!

实现真正意义上的沉浸式VR,关键就在于光场技术。虚拟现实要呈现人眼无法分辨的虚拟内容,就必须要记录外部世界的完整光场信息,并将这些信息无损失地复现出来,才能使人眼获得在自然状态下观看的真实感觉。也只有这样,虚拟现实所需要的沉浸感和走入、走出效果才能淋漓尽致地表现出来,而这也正是叠境数字科技第一阶段的目标。叠境核心成员十多年专注于光场和人工智能的研究,并且取得众多突破性的进展。

ai转换vr

当前,AR/VR技术越来越普及,与我们衣食住行都息息相关,如何让这项前沿技术更好地为人民服务,成了很多企业思考的方向。在医疗领域,运用AR识别,精准定位,智能医疗设备就可以通过红外扫描建模,再进行精准定位,实现医疗和AR技术相结合;在工业领域,通过AR智能识别、定位,智能焊接机器人完成的工艺质量及速度都可以有极大的提升。AR/VR与AI智能的融合,让传统行业和前沿科技深度结合,有了更大发展空间。

联想新视界智能科技有限公司位于红谷滩区VR产业基地,是联想人工智能板块的南方总部公司。记者采访时,这里的虚拟人研发工作小组正在测试虚拟人智能语音对话功能。研发人员告诉记者,目前,公司正在全力打造一款针对6-13岁学生的智能学校食堂APP,为他们提供饮食定制及科普教育,这款APP还采用了虚拟人这一项特色功能。

联想新视界智能科技有限公司项目经理任梦通:“我们目前是在做平安云厨项目,根据学生一周的食谱,给学生做一个营养报告。虚拟人会给学生提出一个膳食的建议,帮助学生有一个合理科学的饮食。目前,虚拟人膳食专家库正在做。预计虚拟人和平安云厨APP连调正式上线要在今年年底或明年年初。”

作为总部型企业,联想新视界持续聚焦“数字内容、新基建、AI工程”领域,先后完成了VR+医疗的热敏灸项目、VR+工业的“智能焊接机器人”等项目,入驻VR产业基地三年来,发展势头迅猛。截至目前,公司在江西的营收已经突破3亿元,并成立了联想人工智能工程研究院。

联想新视界(南昌)人工智能工研院有限公司总经理王晓庆:“我们这几年在做企业客户的同时,也跟省内的好多高校开展合作。我们一方面为这些高校的成果转换提供落地条件,反过来这些高校也为我们从事科研、培养人才提供便利条件。下一步 我们还是重点聚焦我们主业方向、加大研发的投入,为整个南昌的数字经济产业添砖加瓦。”

AR的核心技术,及与人工智能之间的关系

AR/VR常作为孪生兄弟被相提并论,被普遍认为为应用层新技术或者说是“智能可穿戴设备”,相比人工智能相对的“算法”标签,显得不够有深度有内涵高大上,那AR和人工智能之间到底是什么关系?AR属不属于当下我们认知中的人工智能?

AR属不属于人工智能?看完本文你就懂了 AR资讯

2018年3月,上海市经济和信息化委员会公示了2018年第一批本市人工智能创新发展专项拟支持项目。“一共有19家创新企业入围,亮风台作为AR公司也入围此次支持项目”亮风台工作人员告诉青亭网,这不是AR企业第一次被划归到人工智能,但这种归类方式也并不常见。据了解此专项由经信委与市财政局联合开展,拟支持金额超过1亿。

简单梳理下AR的核心技术

AR(Augmented

Reality),是在现实世界中叠加虚拟信息,也即给现实做“增强”,这种增强可以是来自视觉、听觉乃至触觉,主要的目的均是在感官上让现实的世界和虚拟的世界融合在一起。

其中,对现实世界的认知主要体现在视觉上,这需要通过摄像机来帮助获取信息,以图像和视频的形式反馈。通过视频分析,实现对三维世界环境的感知理解,比如场景的3D结构,里面有什么物体,在空间中的什么地方。而3D交互理解的目的是告知系统要“增强”的内容。

这其中有几个关键点:

首先是3D环境理解。要理解看到的东西,主要依靠物体/场景的识别和定位技术。识别主要是用来触发AR响应,而定位则是知道在什么地方叠加AR内容。定位根据精度的不同也可以分为粗定位和细定位,粗定位就是给出一个大致的方位,比如区域和趋势。而细定位可能需要精确到点,比如3D坐标系下的XYZ坐标、物体的角度。根据应用环境的不同,两种维度的定位在AR中都有应用需求。在AR领域,常见的检测和识别任务有人脸检测、行人检测、车辆检测、手势识别、生物识别、情感识别、自然场景识别等。

在感知现实3D世界并和虚拟内容融合后,需要以一定方式将这种虚实融合信息呈现出来,这里面需要的就是AR中的第二个关键技术:显示技术,

目前大多数的AR系统采用透视式头盔显示器,这其中又分为视频透视和光学透视,其他的代表有光场技术(主要因Magic

Leap而显名)、全息投影(在科幻影视剧作品中常出现)等。

AR中的第三个关键技术在于人机交互,用以让人和叠加后的虚拟信息互动,AR追求在触摸按键之外自然的人机交互方式,比如语音、手势、姿态、人脸等,用的比较多的语音跟手势。

人工智能和AR的技术关联

在人工智能领域有几个概念常被提及,如深度学习(DL)、机器学习(ML),在学术领域包括人工智能(AI)在内几大领域均有自己的研究界限,而在普遍意义上,我们常说的是泛意的人工智能,涵括所有“让机器像人一样”的技术的应用方向。

从这张图也可以简单一窥三者的关系,深度学习是实现机器学习的一种技术方式,而机器学习是为了让机器变得智能,去达到人工智能。可以说人工智能是最终目标,而机器学习是为了实现这个目标延伸出的一个技术方向。在这其中,还有另一个重要概念为计算机视觉(CV),主要来研究如何让机器像人去“看”,是目前人工智能概念中的一个重要分支,这也是因为人类获取信息最主要的方式之一就是视觉,目前计算机视觉已经在商业市场发挥价值,比如人脸识别;自动驾驶中读取交通信号和注意行人以导航;工业机器人用来检测问题控制过程;三维环境的重建图像的处理等等。这些概念既有区分也有一定范围的重叠。

其中,2006年开始,Hinton引发的深度学习热潮开始蔓延,在一定程度上带动了AI的又一次崛起,十年中,在包括语音识别、计算机视觉、自然语言处理在内的多个领域取得重大突破,并向应用领域延伸,正发展的如火如荼。

在AR的核心技术中,3D环境理解、3D交互理解和计算机视觉、深度学习都有着紧密的联系。3D环境理解在学术界里主要对应的是计算机视觉领域,而近年来深度学习在计算机视觉中得到广泛应用。交互方面,更趋自然的交互方式如手势和语音在硬件终端的使用,得益于近几年深度学习在相关领域的突破。也可以说,深度学习在AR中应用主要在视觉关键技术。

目前,AR最常见的形式是2D图片扫描识别,如腾讯QQ-AR火炬活动、支付宝五福等多数AR营销中所见,用手机扫描识别图出现叠加的内容,但主要的研发方向还在3D物体识别和3D场景建模。

现实的物体是以3D形态存在的,有不同的角度和空间方位。所以一个自然的扩展就是从2D图片识别到3D物体识别,识别物体的类别和姿态,深度学习可以用在这里。以水果识别为例,识别不同类别的水果,并且给出定位区域,即集成了物体识别与检测的功能。

3D场景建模,从识别3D物体扩大到更大更复杂的3D区域。比如识别场景里面有哪些东西、它们的空间位置和相互关系等等,这就是3D场景建模,是AR比较核心的技术。这其中涉及目前热门的SLAM(实时定位与地图构建)。通过扫描某个场景,然后在上面叠加虚拟战场等三维虚拟内容。如果只是基于普通2D图像识别就需要有特定的图片,而在图片不可见时会识别失败。而在SLAM技术里面,即使特定平面不存在,但是空间定位依然非常精确,就是因为有周围3D环境的帮助。

这里想探讨下深度学习和SLAM技术的融合,计算机视觉大体上可以分两个流派,一种基于学习的思路,例如特征提取-特征分析-分类,目前深度学习技术在这一路线上取得了主导性的地位。另外一种路线是基于几何的视觉,从线条、边缘、3D形状推出物体的空间结构信息,代表性的技术就是SFM/SLAM。基于学习的方向上深度学习基本上一统天下,但是在基于几何视觉的领域,目前相关的进展还很少。从学术界而言,深度学习技术的研究进展可以说日新月异,而SLAM技术最新十年的进展相对较少。在国际视觉顶级会议ICCV

2015年度组织的SLAM技术专题讨论会上,基于近年深度学习在视觉其它领域的快速发展,有与会专家曾提出SLAM中采用深度学习的可能性,但是目前还没有成熟的思路。总体而言,短期内将深度学习和SLAM融合是一个值得研究的方向,长远来看联合语义和几何信息是一个非常有价值的趋势。因此,SLAM+DL值得期待。

在交互方式方面,主要的包括语音识别和手势识别,语音识别在目前已经取得了较大进展,国内如百度、科大讯飞、云知声等都是其中的佼佼者,AR公司更想突破的是手势识别的成熟商业化。

“亮风台展示过的一款基于深度学习的手势识别系统,主要定义了上下左右、顺时针、逆时针六种手势”亮风台工作人员告诉青亭网,先实现人手的检测和定位,然后通过识别相应的手势轨迹来实现对人手势的识别。虽然人脸识别等其他人工智能热门领域在AR中也有使用,但不是AR公司重要的研发方向。

以上不难看出,AR的底层技术或者说基础部分是计算机视觉以及关联领域的融合,而当下热门的深度学习和AR的结合,也是算法工程师们的努力方向。这也是AR为计算机视觉与人机交互的交叉学科,AR的基础是人工智能和计算机视觉等说法的依据。

20180528163858218.png

图:计算机视觉与AR流程关联

在去年今日头条发布的《人工智能影响力报告》中也简单统计了人工智能科学家的分布情况,这其中包括人脸识别、语音识别、机器人、AR、芯片等领域的公司与大型研发机构,高端研发人员的分布也说明了AI领域的细分方向。

那AR究竟是不是人工智能?

对AR从业者来说,理想的状态是用更智能的AR终端去取代智能手机,所以对于用户来说接触使用AR首先受影响的是内容,其次是终端,AR产业链可以粗略划分为技术提供商、智能终端研发公司,以及AR内容提供商。在这其中,AR设备提供商不可避免关注硬件技术,如底层的芯片、电池、光学镜片等,以及硬件本身的性能优化,而内容提供商更倾向于在现有技术基础上优化内容及表现。所以我们可以说AR技术提供商,或者说在底层算法研发上有一定成绩的AR公司是人工智能公司。

对公司来说,特别是创企会把底层技术转化为成熟的产品或服务,这可能是如无人机、AR智能终端、机器人等,也可能是行业解决方案,以达到商业目的,并且这已经成为在沸腾声音之后,媒体、企业以及大众对AI企业的期待和要求。近期,人工智能产业发展联盟(AIIA)出版的图书《人工智能浪潮:科技改变生活的100个前沿AI应用》将对外发布,以及涵括了目前巨头公司以及创企在商业化上的前沿成果,也直接反映了AI目前的主要商业化方向。

作为技术驱动的商业领域,无论是AR还是人工智能的其他多数方向,技术距离完全成熟还有很长的路程要走,在整个产业链逐渐繁荣,关注商业化实现的同时,也需要有更多公司机构去不断拓展技术边界,建立核心竞争力,让行业爆发更大的价值与潜力,如此,AI时代中国弯道超车当可期。

人工智能与VR是何关系 VR是否需要AI支撑

据传媒投资大佬谈人工智能与VR技术的关系:VR的最佳模式就是叙事模式,未来可能是会需要AI技术的支持,对此,各位AR、AI爱好者是怎么看,未来也许VR、AI不分家。

Rob Ogden目前任职于麦迪逊威尔斯传媒(Madison Wells Media),担任战略与合作发展执行副总裁。自从他2016年5月加入这家公司之后,便在公司的战略方向调整和投资方向上扮演了关键性的角色;在这期间,公司投资了Wevr,Atom Tickets和The Void数家以VR媒体内容为主要业务的企业。那么,这位传媒投资界的精英是如何看待VR叙事的发展方向和关键要素的呢?前日,他撰写了一篇题为“AI与叙事:看似遥远的友谊”的文章,讲述他对VR内容创作和人工智能技术这二者关系的看法。

文章指出,最适合VR内容的叙事模式是自然叙事,这是一种不同于传统叙事方式的高自由度多可能性叙事方式,也是最接近真实世界内容的叙事方式。这种叙事方式在传统媒介上是难以实现的,而VR恰恰是能够实现、并且是模仿这一叙事模式的最佳载体。

但要实现这一叙事,仅仅靠随机是不够的。自然叙事最基础的材料其实是人的不可预测性,而没有足够人数的支撑,原本有无限可能的VR世界将会被限定为几个顶层世界所垄断,这就失去了虚拟现实最大的价值之一:无限可能性。而能够解决这一问题的答案就是人工智能技术。AI和VR之间的这一层共生关系常常被人所忽视,但实际上AI是解决VR内容问题的一大关键。

文章内容看似天马行空,然而却向我们揭示出一些VR媒体行业高层对VR内容发展前景的洞见,对VR从业者或有启迪。

原文如下:

当我们谈到互动VR作品中的叙事时,至少有一件事是确定的:没有人知道全部的答案。

一方面,人们批评那些来自好莱坞的VR作品太拘泥于自己的2D银幕经验;另一方面,评论者又批评游戏开发者只注重重复任务和游戏机制。但事实上,VR既不是电影,也不是单纯的游戏,要在VR里讲好故事,既需要好莱坞的叙事技术,也需要来自科技界的创新。要弄明白这一点,首先要从厘清叙事类型开始

叙事技术类型与相应载体

· 线性叙事。自从人类能够实现交流以来就存在的最传统的叙事类型。故事有开头,有过程,有结尾,一切都是预先注定好的。例子:传统出版小说,戏剧,电影等等。

· 分支叙事。半互动性质的叙事方式,在其中观众可以影响故事结局的方向。有若干条固定的发展路径(或者情节排列方式)。例子:观众选角扮演系列童书,Telltale(美国游戏制作公司,擅长剧情类和同名改编类游戏,代表作《行尸走肉》《侏罗纪公园》等)出品的游戏。

· 自然叙事。全互动性质的叙事方式,有无限的发展可能。例子:生活。

那么,最适合VR的叙事形式是什么?在最理想的的层面,虚拟现实有能力达到这样的程度:一个世界。你可以进入、探索、体验,就如同体验真实世界一样。因此,从直觉上你会想要使用最能够模拟真实体验的叙事形式,那就是自然叙事。但是如何能够达到这一点?这说起来就有些复杂了。

在电影和电视的世界中,线性叙事无疑是最佳的选择。它要讲的是一个完整的故事,这个故事经过精心的打磨和雕琢,意在成为这个故事所能成为的那个最佳版本。一本传统小说或者剧本在正式出版、进入消费环节之前往往要经过无数次不厌其烦的修改和编辑,这对故事的质量颇有裨益。在这种语境下,为分支叙事创作额外的内容的成本极其高昂,而创作者付出精力创作的支线情节可能只是被观众当做剧情的碎片。自然叙事在这里更不必提,从机制上就是不可能的。

在游戏世界中,线性叙事往往也是最佳的选择,这是出于和上面同样的原因:成本。创作多重叙事会增加成本;而且,即使在电脑这个载体上进行这样的创作逻辑上会稍微简单些,多重叙事的难度依旧很高。自然叙事在游戏世界里开始成为可能,尤其是在MMO(massively multiplayer online games,大型多人在线游戏)这个体裁里最有可能出现。在MMO游戏中,许多角色是由人类玩家扮演,于是他们能够如同人类一样行动,也就是说,他们的行动相对而言是无法预测的。

MMO策略适用于VR叙事吗?

那么,VR是否能依靠MMO的策略来达成可信的自然叙事呢?

答案是否,原因如下。

· 即使是MMO,也会经常使用剧情动画(也就是一种线性叙事的方式)来讲述关键情节或者复杂内容。但是在VR中,你无法在第一人称视角下随意插入剧情动画。第一,这会导致晕眩;第二,更重要的是,这会严重破坏沉浸感和怀疑暂停状态(suspension of disbelief,文艺理论中的一种状态,指读者在这种状态下不会倾向于怀疑和批判作品提供的信息,作品的叙事是可信的),而这正是VR最独特和最有价值的地方。

· 理论上VR能够支持无限数量的世界,但事实上不论进入VR世界的玩家有多少,最终一定只会有少数几个世界(也就是最受欢迎的那些)达到一定的规模,有足够的玩家数量来形成更接近“真实”的世界。如果没有足够的初始用户群,一个新生的世界很难能够达到足够的人数规模,有足够的角色在其中行动、足够真实。

· MMO要求玩家“扮演”他们化身的角色,在通常的MMO游戏里这倒是没什么问题,毕竟大家都是有着相同目标、面临着同样挑战的大英雄。但在虚拟现实世界里,如果要营造真实感,打造自然叙事,就要有丰富多样的角色。可哪个玩家会想去虚拟快餐店当个虚拟服务员天天拖虚拟地板呢?

AI支持下的VR自然叙事

那么,打造VR世界叙事的答案究竟是什么?

是人工智能。AI和VR可能是当下在科技圈最流行的几个词,但这二者之间可能存在的一种共生关系却常常被人所忽视。现在,科技界在AI开发上投入了巨量的资源,但AI通常应用的领域是数据分析、聊天机器人、虚拟助手和无人驾驶。人们似乎忘记了,AI一直以来都是游戏的关键组成部分之一,但即使在如今最先进的游戏中,使用的AI也十分粗糙简陋,根本无法造就一个自然世界中的“真实”角色。这很大程度上是因为目前的游戏并不需要那么高级的AI。但VR则不同。VR所承诺的沉浸体验给自己创造了这样一个挑战,必须要结合硅谷的技术力量、游戏产业的交互经验、和好莱坞的叙事DNA,才有可能真正达成。

那么,如果我们真的能够让AI可信地模仿人类的决策逻辑,好莱坞式的体系化叙事经验是否就过时了呢?我并不这样认为。首先,你需要有经验的创作者来设定最基础的AI人格和行为模式,仅仅只是随机并不能生成真实、可信、有意思的角色。就好像《西部世界》里安东尼·霍普金斯扮演的那个角色一样,那就是一个创造AI角色的高手。即使是在AI为动力的VR世界中,我们依然需要能够描绘出故事的基本蓝图。

总结

AI到底能为VR带来什么呢?它能为VR的无限世界带来生命之息,它能让VR真正成为VR技术所承诺的那个提供沉浸体验、有着无限可能的“另一个宇宙”,这是VR可为之事,也是应为之事。它能让原本荒芜的无限世界中诞生角色,而且是真实可信的角色,任何进入任何一个世界的玩家都能够真正享受这个世界,不论这是一个大型多人在线的世界,还是一个单机的世界。如果科技界、好莱坞和游戏产业能够勠力同心,创造出所需要的工具和应用技术,无限的高信度VR世界才有可能成功。

结语:以上就是首席CTO笔记为大家介绍的关于人工智能怎么和vr结合的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:/AI/6885.html