LLMCompare 采用三维评分体系,综合评估模型的智能能力、API 性能和使用成本。
当前版本(V1.0)基于 Arena AI (lmarena.ai) 的 ELO 排名数据,采用百分制绝对分归一化。
V1.1 将接入 SuperCLUE 和 OpenCompass 数据,采用三榜加权:SuperCLUE(40%) + OpenCompass(30%) + LMSYS(30%)。
基于 AI Ping (aiping.cn) 的公开监测数据,综合吞吐量(50%权重)和可用率(50%权重)计算。
基于输入/输出单价(元/百万 Token),价格越低分数越高。免费模型得满分 100。
根据用户选择的优先级模式动态加权:
Arena AI (lmarena.ai)
国际盲测 ELO 排名,反映真实人类偏好
AI Ping (aiping.cn)
国内 API 性能实时监测,覆盖吞吐量和可用率
厂商官方定价
各厂商官网公开的 API 定价信息
榜单数据:日级更新(每日凌晨自动爬取)
定价数据:日级更新(价格变动时额外通知)
API 性能:基于 AI Ping 最新快照
本平台所有数据仅供参考,排名基于公开信息整理,不构成任何商业建议。
评分算法和权重设计仍在迭代优化中,V1.0 版本的数据来源以 Arena AI 为主,V1.1 将引入更多国内榜单数据。
定价数据可能存在滞后,实际价格请以各厂商官网为准。