**gpt-oss-20b-eddy** 실사용자 중심 Instruction 튜닝 모델 **gpt-oss-20b-eddy**는 [OpenAI의 `gpt-oss-20b`](https://huggingface.co/openai/gpt-oss-20b) 모델을 기반으로, 실제 사용자의 복잡하고 다양한 Instruction를 높은 정확도와 실용성으로 수행하도록 특수 파인튜닝된 모델입니다. 학술적인 벤치마크 성능을 넘어, 현실 세계의 사용자 요청에 유연하고 적절하게 반응하는 것을 최우선 목표로 개발되었습니다. ## 🎯 모델의 핵심 목표 본 모델의 튜닝은 다음과 같은 명확한 목표를 가지고 진행되었습니다. 1. **향상된 Instruction Following**: 단순한 질의응답을 넘어, 여러 단계로 구성된 복잡한 명령이나 미묘한 뉘앙스가 포함된 사용자 지시를 정확하게 이해하고 수행합니다. 2. **실사용 환경 적합성**: 벤치마크 데이터셋에 과적합(overfitting)되는 것을 지양하고, 실제 사용자들이 생성할 법한 비정형적이고 다양한 프롬프트에 대해 안정적이고 유용한 응답을 생성하도록 튜닝되었습니다. ----- ## 📈 성능 평가 (Evaluation) 베이스라인인 `oss-20b` 모델과 비교하여 주요 벤치마크에서 다음과 같은 성능을 보입니다. | 벤치마크 (Benchmark) | `oss-20b` (Base) | `gpt-oss-20b-eddy ` (Ours) | Improvement | | :--- | :---: | :---: | :---: | | **aime25** | 63.33% | **73.33%** | **+10.00%** | | drop | 76.04% | 76.48% | +0.44% | | ARC | 93.86% | 93.88% | +0.02% | | KMMLU-PRO Overall | 36.40% | 36.76% | +0.36% | -----