当前位置:首页 >> 学术资讯 >> 科研信息
小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

【JPCS出版,EI和Scopus双检索】第八届能源技术与材料科学国际学术会议(ICETMS 2024)

【IEEE独立出版,院士报告,高校背书,快至3天录用】第五届信息科学与并行、分布式处理国际学术会议(ISPDS 2024)

【 高录用,快速见刊 | 往届均已见刊检索】第八届可再生能源与发展国际研讨会(IWRED 2024)

2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)

【河南大学主办 | 已有ISSN号丨SPIE独立出版丨录用率高丨检索快】第四届生物医学与生物信息工程国际学术会议(ICBBE 2024)

【提交ACM-ICPS出版, EI&Scopus检索稳定 | 同步提交知网,最快见刊后一个月内知网检索】第三届信息经济、数据建模与云计算国际学术会议 (ICIDC 2024)

【2024算力大会分会 | 前两届已完成EI检索!】2024云计算、性能计算与深度学习国际学术会议(CCPCDL 2024)

【JPCS出版,往届均已见刊检索,最快会后4个月EI检索】第三届智慧能源与能源物联网国际学术会议(SEEIoT 2024)

【四川省人工智能学会、中国民用航空飞行学院联合主办 | ACM出版 | EI(核心),Scopus检索】第四届大数据、人工智能与风险管理国际学术会议  (ICBAR 2024)

【ACM稳定EI检索 | 会议收录率高 | 有ISSN号】2024年智慧教育与计算机技术国际学术会议(IECT 2024)

【JPCS独立出版 (ISSN:1742-6596),往届已见刊并完成EI以及Scopus检索】第八届水动力学与能源电力系统国际学术会议(HEEPS 2024)

【CPCI,CNKI,Google scholar】第三届经济、智慧金融与当代贸易国际学术会议(ESFCT 2024)

【EI Compendex, Scopus检索】2024年图像处理、智能控制与计算机工程国际学术会议(IPICE 2024)

【JPCS出版,华中科技大学协办 | EI (核心),Scopus检索】2024年机器人前沿技术与创新国际会议(FTIR 2024)

2024年亚太计算技术、通信与网络国际会议(CTCNet 2024)

【IEEE精品会议,已确定ISBN号,见刊检索有保障!】第七届机电一体化与计算机技术工程国际学术会议(MCTE 2024)

2024年IEEE第五届控制,机器人与智能系统国际会议(CCRIS 2024)

【中南大学主办 | EI (核心) , Scopus检索】2024年智能驾驶与智慧交通国际学术会议(IDST 2024)

2024年第三届算法、数据挖掘和信息技术国际会议(ADMIT 2024)

2024年IEEE亚洲先进电气与电力工程会议(ACEPE 2024)

2024年第七届机器学习和自然语言处理国际会议(MLNLP 2024)

2024年第七届数据科学与信息技术国际会议(DSIT 2024)

会议展示区

【IEEE独立出版,院士报告,高校背书,快至3天录用!】第五届信息科学与并行、分布式处理国际学术会议(ISPDS 2024)

【高录用、快检索】【SPIE 独立出版 | ISSN: 0277-786X】第三届信号处理与通信安全国际学术会议(ICSPCS 2024)

2024年教育创新国际论坛(IEFI 2024)

【医工结合,高科技行业盛会,行业大咖,院士汇聚,ACM出版】2024年智能医疗与可穿戴智能设备国际学术会议(SHWID 2024)

【浙江工业大学主办,往届均已成功被EI、Scopus检索! EI检索稳定、快速】第五届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2024)

【河南省科学院和河南大学联合主办 | SPIE出版 (ISSN: 0277-786X),往届已被EI收录检索】第二届遥感、测绘与地理信息系统国际学术会议(RSMG 2024)

第七届模式识别与人工智能国际会议 (PRAI 2024)

人工智能研究院朱毅鑫及合作者在赋予AI语言理解和场景感知能力,实现目标导向的室内人体运动生成方向取得重要进展

2024/04/15

近日,人工智能研究院朱毅鑫助理教授课题组在NeruIPS发表论文“HUMANISE: Language-conditioned Human Motion Generation in 3D Scenes,提出了一个大规模且具有丰富语义标注的HSI数据集,即HUMANISE。并且开启了一项新任务,即三维场景中语言约束下的人体运动序列生成。论文进一步设计了一个场景和语言约束的运动生成模型,该模型能够生成多样且语义一致的室内人体运动。

在现实生活中,人可以根据语言指令轻松地执行相应动作,并与场景中物体进行合理交互,如图1所示。在虚拟环境中,如果以同样的方式给虚拟人目标,让其与室内场景进行交互,虚拟人则需要同时具备语言理解、场景感知、以及运动生成的能力。在以往的研究工作中,人体运动生成(Human Motion Generation)是指通过生成模型(Generative Model)产生真实且多样的人体动作序列,在VR/AR、游戏人物动画等方面具有巨大的应用价值。与以往研究不同,本文着重于对目标导向的室内人体运动生成进行研究,这对于人-场景交互(Human-Scene Interaction, HSI)[1,2,3],场景可供性(Affordance)[4] 等相关研究领域具有重要意义。

图1 根据语言指令与场景交互

目标导向的室内人体运动生成是指虚拟人依据语言描述的目标在室内场景中生成相应的运动序列。想象一下,假设虚拟人接受了“sit on the armchair near the desk”的指令,如果虚拟人要完成这一任务,他需要首先理解指令的语义并感知周围环境,才能生成与语言描述一致的人体运动序列。然而,受限于现有HSI 数据集[1,2]的规模和质量,以及缺少相应的语义标注,学习在三维场景中生成以目标为导向且具有多样性的人体运动序列是极具挑战性的任务。

为解决上述问题,本文首先提出了一个大规模、且具有丰富语义标注的合成HSI数据集——HUMANISE。该数据集共包括在643个不同的三维场景中的19.6k段运动序列,总帧数达1.2M帧。基于该数据集,本文尝试解决三维场景中语言约束下的人体运动序列生成这样一个新的任务,旨在生成合理、多样、具有指定动作类型和交互对象的人体运动序列。然而,该任务相比于此前的人体运动生成任务更加困难,主要包括三方面原因:

•三维场景和语言描述同时对人体运动生成构成了约束,需要模型对多模态信息有一个全面的理解;

•生成的人体运动序列需要精确地在目标位置附近执行正确的动作;

•生成的人体运动序列需要同时具备真实性和合理性。

同时,本文基于cVAE[5]框架,结合两个辅助任务,设计了一个新颖的生成模型。定性和定量实验结果表明,该模型能够在三维场景中生成语义一致的多样性人体运动序列。

本文构建合成HUMANISE数据集的核心思想是自动地将动捕得到的人体运动序列(即,AMASS[6])与三维室内场景(即,ScanNet[7])“对齐”。具体而言,对于一段具有特定动作的运动序列(例如,sit),首先在场景中选择可能的交互物体(例如,armchair),同时对交互物体表面可能的交互位置进行采样。之后,通过使用碰撞(collision)和接触(contact)约束对有效的平移和旋转参数进行采样,从而使得平移旋转后的人体和场景之间的交互在物理上合理、且视觉效果上自然。同时,我们参考Sr3D[8]使用基于模板的语言描述自动对合成运动序列进行标注。

最终,合成的HUMANISE数据集包括四种不同类别的动作,即“walk”“sit”,“stand up” 和“lie down”。图2和图3分别展示了HUMANISE数据集中的部分数据预览以及部分渲染动画。

图2 HUMANISE数据集预览

图3 HUMANISE部分数据的渲染动画

基于HUMANISE数据集,本文提出了一个新的生成任务——三维场景中语言约束下的人体运动序列生成。具体而言,给定一个三维场景和一段语言描述,其目标是生成真实且多样的人体运动序列,同时该运动序列需要满足与语言描述一致、在三维场景中合理。

图4 三维场景中语言约束的人体运动生成

为此,本文构建了一个基于cVAE框架的生成模型,该模型使用两个Encoder分别对输入的场景和语言进行编码,并使用自注意力机制融合这两个不同模态的信息以生成条件嵌入(conditional embedding)。该模型使用循环神经网络对输入的运动序列进行编码,并使用Transformer Decoder进行解码以输出人体运动序列。本文进一步设计了两个辅助损失函数,分别用于定位目标物体和识别动作类别。定性和定量的实验结果表明,本文所提出的模型能够在给定三维场景中生成具有多样性、且与语言指令语义一致的人体运动序列,并且在各种评价指标上优于基线方法。

图5 定性可视化实验结果

图6 定量实验结果

图7的消融实验结果表明,在没有辅助损失函数的情况下,模型很难生成指定的动作以及定位到指定的交互物体,而完整模型能够更好地帮助模型识别语言所描述的动作类别以及目标交互物体。

图7 消融实验

在这项工作中,本文提出了一个大规模且具有丰富语义标注的HSI数据集,即HUMANISE。它包含各种各样的、在物理上合理的人-场景交互运动序列,同时每段运动序列都标注有相应的语言描述标注。HUMANISE开启了一项新任务,即三维场景中语言约束下的人体运动序列生成。本文进一步设计了一个场景和语言约束的运动生成模型,该模型能够生成多样且语义一致的室内人体运动。

本文作者为王赞(北京理工大学/北京通用人工智能研究院)、陈以新(北京通用人工智能研究院)、刘腾宇(北京通用人工智能研究院),通讯作者为朱毅鑫(北京大学)、梁玮(北京理工大学/北京理工大学长三角研究院)、黄思远(北京通用人工智能研究院)。

参考文献

[ 1 ] Hassan, Mohamed, et al. "Resolving 3D human pose ambiguities with 3D scene constraints." Proceedings of the IEEE/CVF International Conference on Computer Vision. 2019.

[ 2 ] Cao, Zhe, et al. "Long-term human motion prediction with scene context." European Conference on Computer Vision. 2020.

[ 3 ] Chen, Yixin, et al. "Yourefit: Embodied reference understanding with language and gesture." Proceedings of the IEEE/CVF International Conference on Computer Vision. 2021.

[ 4 ] Xu, Chao, et al. "PartAfford: Part-level Affordance Discovery from 3D Objects." arXiv preprint arXiv:2202.13519. 2022.

[ 5 ] Sohn, Kihyuk, Honglak Lee, and Xinchen Yan. "Learning structured output representation using deep conditional generative models." Advances in Neural Information Processing Systems. 2015.

[ 6 ] Mahmood, Naureen, et al. "AMASS: Archive of motion capture as surface shapes." Proceedings of the IEEE/CVF International Conference on Computer Vision. 2019.

[ 7 ] Dai, Angela, et al. "Scannet: Richly-annotated 3d reconstructions of indoor scenes." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017.

[ 8 ]Achlioptas, Panos, et al. "Referit3d: Neural listeners for fine-grained 3d object identification in real-world scenes." European Conference on Computer Vision. 2020.


版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

第四届计算机图形学、图像与虚拟化研究国际会议(ICCGIV 2024)(2024-05-17)

第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)

2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)

第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)

2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)

第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)

2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)

2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)

第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)

2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)

第五届语言、艺术与文化交流国际学术会议(ICLACE 2024)(2024-5-31)

2024年第四届电子器件与应用国际会议(ICEDA 2024)(2024-10-21)

2024智慧城市、轨道交通运输与工程管理国际会议(ICSRTEM 2024)(2024-6-26)

2024年生物医学与生物信息学国际学术研讨会(ISBB 2024)(2024-6-25)

2024文化产业、旅游管理与经济发展国际会议(ICCITMED 2024)(2024-5-25)

第四届机械设计与智能制造国际会议(MDSM 2024)(2024-8-23)

2024年兽医学与生物医用材料国际会议(ICVMBM 2024)(2024-6-29)

2024金融创新、经济发展与社会科学国际会议(IFEDS 2024)(2024-5-20)

2024年人工智能、算法与自动化工程国际学术会议(ICAIAAE 2024)(2024-5-28)

2024年桥梁、隧道与建筑工程国际会议(ICBTCE 2024)(2024-6-22)


2024年粤港澳大湾区教育数字化与计算机科学国际学术会议(EDCS 2024)
第五届机械工程与智能制造国际学术会议(MEIM 2024)
2024年计算机视觉、机器人与自动化工程国际学术会议(CRAE 2024)
第九届信息科学、计算机技术与交通运输国际学术会议(ISCTT 2024)
2024年土木工程结构与混凝土材料国际学术会议 (CESCM 2024)