| 제목 | 내용 | 토픽 |
| 차세대 AI 리더보드 구현 | - AI 모델 성능을 신뢰할 수 있고 공정하게 비교할 수 있는 리더보드 시스템 구축 - 생성형 AI가 주어진 물음에 얼마나 정확하고 일관된 답을 제공하는지를 평가할 수 있는 자동화된 평가 도구와 이를 위한 데이터셋 구축 - 모델 등록부터 평가 결과 확인까지 가능한 웹 기반 플랫폼, 명확한 평가 기준과 점수 산정 방식, 부정확하거나 편향된 답변을 점검할 수 있는 항목 등을 포함한 평가 체계 마련 계획 |
AI 성능평가 |

'전자신문 > 2025 전자신문' 카테고리의 다른 글
| 250806 전자신문 (0) | 2025.08.08 |
|---|---|
| 250805 전자신문 (0) | 2025.08.08 |
| 250801 전자신문 (0) | 2025.08.08 |
| 250731 전자신문 (0) | 2025.08.08 |
| 250730 전자신문 (0) | 2025.07.30 |