从显式元素到隐式意图：用于可审计行为推理的预定义库

摘要

arXiv:2606.11207v1 Announce Type: new Abstract: We present SemantiClean, a modular framework for extracting structured semantic signals from e-commerce session data and driving pluggable inference tar

and inference the for element

2026-06-11 1 阅读约1分钟阅读 Liu hung ming

arXiv:2606.11207v1 公告类型：新摘要：我们提出了 SemantiClean，这是一个模块化框架，用于从电子商务会话数据中提取结构化语义信号，并通过共享元素库驱动可插入推理目标，包括购买意图、客户细分和产品亲和力。与仅针对准确性进行优化的传统端到端预测器不同，SemantiClean 优先考虑可审核性、结构治理和 sigma=0 再现性，明确用边际预测收益换取元素级透明度和可靠的决策轨迹。该框架以在线购物者购买意向 (OSPI) 数据集为基础，将 24 个行为元素组织成四层架构（功能、交互、系统、上下文），并通过三种反通货膨胀机制强制执行信号质量：RedundancyGroup 贡献上限、TieredPenaltyCalculator 偏差处罚和 AdaptiveConstraintMode 冷启动保护。本报告介绍了 LLM 集成语义推理引擎，这是一个完全实现的两阶段 LLM 驱动的推理架构，在推理时利用完整的元素元数据。本文报告的所有定量结果均由该引擎产生。确定性引擎输出保持完全可再现（sigma=0）； LLM 相关结果（E8、E10）受固定提供商/模型/温度设置下受控输出变化的影响。性别推断目标在当前实施中仍然不起作用，并且被排除在所有定量结果之外。

订阅66必读