H-EmbodVis

university

https://github.com/H-EmbodVis

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

LMD0311 authored a paper about 2 months ago

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

LMD0311 submitted a paper about 2 months ago

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

LMD0311 published a model about 2 months ago

H-EmbodVis/HERMESV2

View all activity

Papers

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models

View all Papers

H-EmbodVis 's papers 6

Submitted by

Xin Zhou

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

H-EmbodVis

64 2

Submitted by

Dingkang Liang

116

When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models

H-EmbodVis

69 4

Submitted by

Dingkang Liang

157

Out of Sight but Not Out of Mind: Hybrid Memory for Dynamic Video World Models

H-EmbodVis

257 4

Submitted by

Dingkang Liang

Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding

H-EmbodVis

418 5

Submitted by

Dingkang Liang

Towards Generalizable Robotic Manipulation in Dynamic Environments

H-EmbodVis

211 2

Submitted by

Dingkang Liang

Cook and Clean Together: Teaching Embodied Agents for Parallel Task Execution

H-EmbodVis

363 2

AI & ML interests

Recent Activity

Papers

Team members 7

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models

Out of Sight but Not Out of Mind: Hybrid Memory for Dynamic Video World Models

Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding

Towards Generalizable Robotic Manipulation in Dynamic Environments

Cook and Clean Together: Teaching Embodied Agents for Parallel Task Execution