← 返回 AI Lab
AI Lab
单目 3D 目标检测
上传一张普通照片,AI 预测场景中物体的三维位置和尺寸。基于 3D-MOOD(ICCV 2025)模型。
工作原理
📷
单张图像输入
只需一张普通 RGB 照片,无需深度传感器或多视角拍摄。
🔤
开放集检测
基于 Grounding DINO,输入文本描述即可检测任意类别的物体。
📦
3D 边界框预测
预测每个物体的 3D 中心、尺寸和朝向,投影到图像上可视化。
预设演示
点击卡片查看 3D-MOOD 的检测结果,彩色框表示预测的 3D 边界框。
室内场景
chairtablesofalamp
检测房间内的家具和物品,预测 3D 空间位置
点击查看 3D 检测结果↓
客厅场景
sofatablelampshelf
客厅环境中的多目标 3D 检测
点击查看 3D 检测结果↓
复杂场景
chairtablebedcabinet
复杂室内场景的 3D 目标定位
点击查看 3D 检测结果↓
自己试试
📷
点击上传图片
JPG / PNG / WebP
或试试示例:
检测类别
支持开放集检测,可输入任意英文物体名称
模型:3D-MOOD Swin-T(ICCV 2025, ETH Zurich) · 推理:HuggingFace Space API · 开放集 3D 检测