Berkeley开发了一个名为Prompt-to-Leaderboard(P2L)的路由系统。该系统通过利用1.5M个chatbot arena评分的QA对进行训练,利用生成向量评估prompt特征,进而将问题路由到合适的模型。P2L在Chatbot Arena上取得了1400分的ELO评分,与耗费20万GPU卡训练的Grok 3相当。
Berkeley开发了一个名为Prompt-to-Leaderboard(P2L)的路由系统。该系统通过利用1.5M个chatbot arena评分的QA对进行训练,利用生成向量评估prompt特征,进而将问题路由到合适的模型。P2L在Chatbot Arena上取得了1400分的ELO评分,与耗费20万GPU卡训练的Grok 3相当。