10月27日消息,近日,superclue正式推出首期agentclue-mobile手机gui agent(离线)测评报告。
在此次评测中,小米集团推出的MiMo-VL-7B-RL-2508表现突出,从参评的13款国内外智能体产品中脱颖而出,以总分90.01分的优异成绩荣登榜首,摘得金牌。
测试结果显示,小米智能体在任务完成率、平均动作类型准确率以及平均动作细节精准匹配率等多项关键指标上均表现出色。
据悉,本次测评基准专为中文原生环境设计,任务设置基于中国用户日常使用手机的真实场景,充分贴合本土用户的操作习惯。
A

通过这七大场景与两大核心能力的综合测试,AgentCLUE-Mobile为手机端智能代理的性能提供了系统化、高精度的评估依据。
