开发者生态
evening
推出 HN:转运 (YC P26) – 使用闭路电视测量货运物品
2026-06-09
1 阅读
nils_spatial
你好,HN——我们是 Julius、Jago 和 Nils,我们正在构建 transload (transload.io)。 transload 帮助零担货运公司使用其码头中已安装的安全摄像头测量货物尺寸。我们不是通过专用的尺寸测量站发送货物,而是在货物通过正常的码头工作流程时自动对其进行测量。我们在这里搭建了一个专门针对 HN 的小型演示网站:https://hn.transload.io/ 在零担货运中,尺寸很重要,因为它们会影响定价、货运分类和拖车利用率。如果货物大于托运人报告的货物,承运人可能会少收费用,同时仍放弃相同数量的拖车空间。显而易见的解决办法是测量每批货物,但这在繁忙的货运码头中是非常困难的。专用尺寸标注系统适用于经过它们的货物,但它们可能会增加叉车行程,造成码头拥堵,并改变正常的工作流程。实际上,许多码头仅测量其货物的样本。 Jago 通过其家族的零担卡车运输和越库转运业务与这个行业密切相关。我们并没有开始构建货运尺寸。我们的第一个想法是建立一个人工智能系统,用于优化跨码头码头内的叉车路线。在与客户交谈并与 50 多家货运公司交谈后,我们意识到叉车路线并不是人们不断提出的难题。货运尺寸为。与此同时,我们看到空间人工智能正在快速推进。单目度量深度估计已变得更加出色,无需昂贵的 LiDAR 传感器即可从普通摄像机镜头中恢复准确的 3D 结构。 MapAnything ( https://github.com/facebookresearch/map-anything ) 和 MoGe ( https://github.com/microsoft/moge ) 是两个例子。货运码头还具有有用的结构:固定摄像头、重复的工作流程、条形码扫描时间戳和已知的布局。几乎每个仓库都已经安装了闭路电视。这给我们带来了一个简单的问题:如果我们可以使用现有的安全摄像头完全在后台自动测量货运,会怎样?这将使承运人能够在不改变码头工作流程的情况下测量每批货物。我们的系统有两个主要步骤:将条形码扫描连接到视频中的正确对象,然后以现实世界单位估计该对象的尺寸。码头工作人员已经将扫描货物作为正常工作流程的一部分。每次扫描都会给我们一个时间戳和一个处理单元 ID。围绕该时间戳,我们分析视频以推断哪个工人扫描了以及他们扫描了哪批货物。我们希望 VLM 能够处理这个问题;事实证明他们太不可靠了。相反,我们训练自己的模型,根据注视、身体方向和运动等线索进行 3D 推理。该关联步骤至关重要。一个框架可以容纳数十个托盘、多名工人、叉车和部分隐藏的货物。如果我们将扫描附加到错误的物体上,测量就毫无用处。一旦我们知道了目标出货量,我们就会对其进行分段并从单目相机视图中估计出公制 3D 边界框。盒子安装好后,尺寸很简单:长度、宽度、高度和体积直接来自盒子。困难的部分是精确地拟合普通安全摄像头的边界框。单个 2D 图像不会直接告诉您物体的形状或比例,许多不同的 3D 框可以解释看起来相似的图像证据。我们使用对象遮罩、可见边缘、地板接触、相机几何形状和来自终端的约束来查找最匹配场景的 3D 框。我们目前正在与多家零担承运商合作。对于一位客户来说,大约 10% 的托运货物存在尺寸错误。第一个用例是收入回收:识别尺寸不足的货物,附上视觉证据,并帮助承运人纠正计费或分类。从长远来看,相同的数据可以帮助承运商更好地了解拖车利用率。 LTL 货运对于 3D 计算机视觉来说是一个奇怪的地方,我们每周都会学到一些新东西。如果您从事过单目重建、3D 对象检测、仓库感知或混乱的现实世界 CV 工作,我们很乐意接受您的建议。也非常欢迎有关货运、零担码头或技术方法的问题。评论网址:https://news.ycombinator.com/item?id=48463273 积分:16 # 评论:4