alci.dev/ja
リソース
辞書
ミロ テンプレート
Change language
Toggle theme
alci.dev/ja
Change language
Toggle theme
X
ホーム
リソース
辞書
ミロ テンプレート
Evaluation
4 用語
home
アジャイル辞典
カテゴリー
evaluation
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
B
Benchmark(ベンチマーク)
AIモデルやシステムのパフォーマンスを測定し評価するための標準的なテストやメトリクスのセット。
E
Evals (評価)
AIシステムの性能、能力、安全性を測定およびテストするためのフレームワークとツール。
G
Ground Truth(グランドトゥルース)
機械学習モデルの訓練と評価において、正解として使用される実際の、検証済みのデータ。