xAI 发布 Grok 技能并更新用于工具调用的响应 API

xAI发布了 Grok Skills "，并增强了面向Grok 4.3的Responses API "，让模型能够在Web平台、iOS应用和Android应用中的所有对话里持续保留自定义的能力。用户可通过自然语言描述或文件上传一次性创建这些Skills，之后Grok会在后续会话中自动应用已定义的工作流、偏好和文档处理流程，无需重复下达指令。内置能力覆盖完整的文档与内容处理场景，包括可保留标题、表格和样式的Word文档的生成与编辑，视觉层级和演讲者备注的PowerPoint风格演示文稿的创建，支持公式、数据分析、图表和条件格式的Excel电子表格处理，以及PDF创建、合并、拆分、文本提取和内容重组操作。这些Skills在账号级别生效，通过斜杠命令调用时会优先于默认行为，并支持用户间共享以便协作使用。在开发者方面， Responses API "通过工具调用集成了上述概念：一方面遵循与OpenAI兼容的格式，另一方面为内置工具提供了原生服务端执行的能力。开发者可在API请求中通过类型声明要引入工具，例如， web_search "、 x_search "或 code_interpreter "，由xAI基础设施自动处理；也可基于描述名称、说明和参数的JSON Schema创建自定义函数。当Grok 4.3判断需要调用工具时，会返回结构化的 tool_call "对象，其中包含调用标识和参数。客户端应用随后在本地执行逻辑，把结果作为工具输出附加到下一次请求，并继续对话循环。该模型默认支持并行工具调用，单次请求最多支持128个工具，具备100万token的上下文窗口，并可输出适用于多步骤Agentic任务的结果。在聊天界面创建的自定义Skills也可用来补充API流程，开发人员可以将这些指令合并到他们的系统提示或状态管理中。。在 X "上的社区讨论呈现出兴奋与早期试用并存的态势，用户普遍强调其在工作流中的实际价值。软件开发者 Tiago Rama "发文称：在其他AI工具中，自定义Skills/工作流自动化正在成为默认能力，所以Grok确实需要在这方面跟上节奏。与此同时，开发者 William Wallace "分享了一个连接GitHub的Grok Skill示例，并表示：我已经启用Grok连接我的Github账号进行读取和提交。我添加了这个context.md文件，用来在多轮开发对话中维护上下文。与 OpenAI Skills "、 Claude Skills "以及Vercel Agent Skills "等类似方案相比， Grok Skills "更像是可复用的工作流与能力层，而非可完整部署的自治智能体系统。Vercel Skills侧重以可组合能力扩展开发者和Web应用的工作流，OpenAI与Anthropic当前则更聚焦于更广义的Agent生态、工具调用以及长上下文协作模型。Grok Skills的差异化在于与X平台的紧密集成，将可复用指令、搜索、多模态能力和社交上下文结合为轻量级的平台原生工作流。查看英文原文： xAI Releases Grok Skills and Updates Tool Calling Responses API "