Chinese LLM ベンチマークは、335の大規模AIモデルを対象にした能力評価ツールです。ChatGPTやGPT-5.2、Google Gemini 3 Proなどの商用モデルに加え、様々なオープンソースモデルの性能を比較し、200万件以上の欠陥データを提供します。これにより、研究者や開発者がモデルの分析と改善を
コンテンツを見る