alci.dev/ja
リソース
辞書
ミロ テンプレート
Change language
Toggle theme
alci.dev/ja
Change language
Toggle theme
X
ホーム
リソース
辞書
ミロ テンプレート
Utvärdering
2 用語
home
アジャイル辞典
カテゴリー
utvärdering
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
B
Benchmark
En benchmark är en standardiserad test eller mått som används för att utvärdera och jämföra AI-systems prestanda.
E
Evals
Evals är systematiska tester för att utvärdera AI-modellers prestanda, säkerhet och pålitlighet.