1
M\"OVE: A Holistic LLM Benchmark for the German Public Sector
首个专为德国公共部门设计的LLM综合基准,评估行政、法律等场景的模型表现。
arXiv:2606.13111v1 Announce Type: new Abstract: We present M\"OVE (Modelle f\"ur die \"Offentliche Verwaltung Evaluieren), a holistic benchmark for ev…