← 返回 AI Lab

单目 3D 目标检测

上传一张普通照片,AI 预测场景中物体的三维位置和尺寸。基于 3D-MOOD(ICCV 2025)模型。

工作原理

📷
单张图像输入

只需一张普通 RGB 照片,无需深度传感器或多视角拍摄。

🔤
开放集检测

基于 Grounding DINO,输入文本描述即可检测任意类别的物体。

📦
3D 边界框预测

预测每个物体的 3D 中心、尺寸和朝向,投影到图像上可视化。

预设演示

点击卡片查看 3D-MOOD 的检测结果,彩色框表示预测的 3D 边界框。

室内场景

chairtablesofalamp

检测房间内的家具和物品,预测 3D 空间位置

点击查看 3D 检测结果

客厅场景

sofatablelampshelf

客厅环境中的多目标 3D 检测

点击查看 3D 检测结果

复杂场景

chairtablebedcabinet

复杂室内场景的 3D 目标定位

点击查看 3D 检测结果

自己试试

📷

点击上传图片

JPG / PNG / WebP

或试试示例:

检测类别

支持开放集检测,可输入任意英文物体名称

模型:3D-MOOD Swin-T(ICCV 2025, ETH Zurich) · 推理:HuggingFace Space API · 开放集 3D 检测