xAI 发布 Grok 技能并更新用于工具调用的响应 API

2026-06-22 1 阅读 作者: Daniel Dominguez
xAI发布了 Grok Skills ",并增强了面向Grok 4.3的Responses API ",让模型能够在Web平台、iOS应用和Android应用中的所有对话里持续保留自定义的能力。用户可通过自然语言描述或文件上传一次性创建这些Skills,之后Grok会在后续会话中自动应用已定义的工作流、偏好和文档处理流程,无需重复下达指令。 内置能力覆盖完整的文档与内容处理场景,包括可保留标题、表格和样式的Word文档的生成与编辑,视觉层级和演讲者备注的PowerPoint风格演示文稿的创建,支持公式、数据分析、图表和条件格式的Excel电子表格处理,以及PDF创建、合并、拆分、文本提取和内容重组操作。这些Skills在账号级别生效,通过斜杠命令调用时会优先于默认行为,并支持用户间共享以便协作使用。 在开发者方面, Responses API "通过工具调用集成了上述概念:一方面遵循与OpenAI兼容的格式,另一方面为内置工具提供了原生服务端执行的能力。开发者可在API请求中通过类型声明要引入工具,例如, web_search "、 x_search "或 code_interpreter ",由xAI基础设施自动处理;也可基于描述名称、说明和参数的JSON Schema创建自定义函数。当Grok 4.3判断需要调用工具时,会返回结构化的 tool_call "对象,其中包含调用标识和参数。客户端应用随后在本地执行逻辑,把结果作为工具输出附加到下一次请求,并继续对话循环。该模型默认支持并行工具调用,单次请求最多支持128个工具,具备100万token的上下文窗口,并可输出适用于多步骤Agentic任务的结果。在聊天界面创建的自定义Skills也可用来补充API流程,开发人员可以将这些指令合并到他们的系统提示或状态管理中。。 在 X "上的社区讨论呈现出兴奋与早期试用并存的态势,用户普遍强调其在工作流中的实际价值。 软件开发者 Tiago Rama "发文称: 在其他AI工具中,自定义Skills/工作流自动化正在成为默认能力,所以Grok确实需要在这方面跟上节奏。 与此同时,开发者 William Wallace "分享了一个连接GitHub的Grok Skill示例,并表示: 我已经启用Grok连接我的Github账号进行读取和提交。我添加了这个context.md文件,用来在多轮开发对话中维护上下文。 与 OpenAI Skills "、 Claude Skills "以及Vercel Agent Skills "等类似方案相比, Grok Skills "更像是可复用的工作流与能力层,而非可完整部署的自治智能体系统。Vercel Skills侧重以可组合能力扩展开发者和Web应用的工作流,OpenAI与Anthropic当前则更聚焦于更广义的Agent生态、工具调用以及长上下文协作模型。Grok Skills的差异化在于与X平台的紧密集成,将可复用指令、搜索、多模态能力和社交上下文结合为轻量级的平台原生工作流。 查看英文原文: xAI Releases Grok Skills and Updates Tool Calling Responses API "