智能AI morning

从显式元素到隐式意图:用于可审计行为推理的预定义库

2026-06-11 1 阅读 Liu hung ming
arXiv:2606.11207v1 公告类型:新 摘要:我们提出了 SemantiClean,这是一个模块化框架,用于从电子商务会话数据中提取结构化语义信号,并通过共享元素库驱动可插入推理目标,包括购买意图、客户细分和产品亲和力。与仅针对准确性进行优化的传统端到端预测器不同,SemantiClean 优先考虑可审核性、结构治理和 sigma=0 再现性,明确用边际预测收益换取元素级透明度和可靠的决策轨迹。该框架以在线购物者购买意向 (OSPI) 数据集为基础,将 24 个行为元素组织成四层架构(功能、交互、系统、上下文),并通过三种反通货膨胀机制强制执行信号质量:RedundancyGroup 贡献上限、TieredPenaltyCalculator 偏差处罚和 AdaptiveConstraintMode 冷启动保护。本报告介绍了 LLM 集成语义推理引擎,这是一个完全实现的两阶段 LLM 驱动的推理架构,在推理时利用完整的元素元数据。本文报告的所有定量结果均由该引擎产生。确定性引擎输出保持完全可再现(sigma=0); LLM 相关结果(E8、E10)受固定提供商/模型/温度设置下受控输出变化的影响。性别推断目标在当前实施中仍然不起作用,并且被排除在所有定量结果之外。