2025年7月29日,郎瀚威及团队发布微软浏览器Copilot综合能力测试报告,将其与OpenAI、Comet、Manus、Genspark在8项任务中对比,涵盖视频总结等多方面能力。
测试结果显示,Copilot平均耗时26秒,正确/错误比例5/3。在各能力上,具备视频总结、报告生成等能力,不具备PPT和表格生成能力,窗口操作能力具备但表现不佳。
Copilot优势明显,快速响应任务效率高,如8秒找到旧金山财务报告链接,32秒完成网球之旅方案,视频摘要能力突出,8秒完成与其他平台相近的总结。但短板也突出,无法创建可下载的Excel、PPT等文件,内容简单缺乏深度,偶尔偏离核心任务,还存在任务快完成时的bug。
其他平台各有特点。OpenAI表现稳定,8项任务全成功;Comet与Copilot能力接近,部分任务表现出色;Manus下限低但上限高,复杂任务能出详尽报告;Genspark在复杂任务中表现佳。
总体而言,Copilot在快速信息整合任务有优势,但内容深度和格式支持不足。用户需权衡效率与质量,其更适合简单快速任务,复杂任务则Genspark和OpenAI更优。未来各平台仍需持续迭代提升。
展开剩余83%免责声明:我们尊重知识产权、数据隐私,只做内容的收集、整理及分享,报告内容来源于网络,报告版权归原撰写发布机构所有,通过公开合法渠道获得,如涉及侵权,请及时联系我们删除,如对报告内容存疑,请与撰写、发布机构联系
发布于:广东省众合网提示:文章来自网络,不代表本站观点。