AIメンタルヘルスのSword Health、現実的な対話でLLMを測る初の多ターン指標「MindEval」を公開
Sword Healthは、メンタルヘルス領域における大規模言語モデル(LLM)の振る舞いを現実に近い形で評価する初のベンチマーク「MindEval」を公開しました。
Sword Healthは、メンタルヘルス領域における大規模言語モデル(LLM)の振る舞いを現実に近い形で評価する初のベンチマーク「MindEval」を公開しました。
...続きを確認する
- 未分類
-
- トップページへ戻る