阿里云开源智能体WebSailor登顶BrowseComp评测榜单

2025-07-08 03:08:27
790

今日阿里云宣布，通义实验室正式开源网络智能体WebSailor，该智能体凭借强大的推理与检索能力，在OpenAI发布的高难度智能体评测集BrowseComp上位列开源榜单首位。目前，其构建方案及部分数据集已在GitHub开源。

WebSailor专为复杂场景设计，能高效处理模糊问题，通过多步推理和交叉验证从海量信息中精准检索答案。通义实验室采用创新的post-training方法，显著提升了模型在网页推理任务中的表现。在BrowseComp评测中，WebSailor-32B和WebSailor-72B版本不仅领先于DeepSeekR1、Grok-3等开源模型，甚至超越部分闭源系统，仅次于OpenAIDeepResearch。

此外，WebSailor在普通任务数据集SimpleQA上也展现出优异性能，验证了其泛化能力。阿里云表示，该智能体的通用工作流及“高难度任务合成+高效RL优化”策略，可为开源社区解决复杂推理、学术发现等挑战提供借鉴。

卦师门主只想摆摊发布网,提供卦师门主只想摆摊发布信息,第一时间发布列表及资讯,卦师门主只想摆摊小说是卦师门主只想摆摊小说首选资讯平台。