AI Lab

单目 3D 目标检测

上传一张普通照片，AI 预测场景中物体的三维位置和尺寸。基于 3D-MOOD（ICCV 2025）模型。

工作原理

📷

单张图像输入

只需一张普通 RGB 照片，无需深度传感器或多视角拍摄。

🔤

开放集检测

基于 Grounding DINO，输入文本描述即可检测任意类别的物体。

📦

3D 边界框预测

预测每个物体的 3D 中心、尺寸和朝向，投影到图像上可视化。

点击卡片查看 3D-MOOD 的检测结果，彩色框表示预测的 3D 边界框。

chairtablesofalamp

检测房间内的家具和物品，预测 3D 空间位置

点击查看 3D 检测结果↓

sofatablelampshelf

客厅环境中的多目标 3D 检测

点击查看 3D 检测结果↓

chairtablebedcabinet

复杂室内场景的 3D 目标定位

点击查看 3D 检测结果↓

📷

点击上传图片

JPG / PNG / WebP

或试试示例：

支持开放集检测，可输入任意英文物体名称

模型：3D-MOOD Swin-T（ICCV 2025, ETH Zurich） · 推理：HuggingFace Space API · 开放集 3D 检测