AI 전문인재 과정 · 2026
Public AI Expert Program
Day 1 · Assignment 01
Hugging Face SLM Research

Hugging Face SLM 모델 조사 보고서

HyperCLOVAX-SEED-Text-Instruct-1.5B · 기술 분석 리포트

Hugging Face에 공개된 1B~7B 규모 Small Language Model 중 HyperCLOVA X SEED 1.5B을(를) 선택해 모델 카드·설정 파일을 분석하고, 공공·행정 업무 활용 가능성을 검토함.

수강생 소속
세종특별자치시교육청
수강생 이름
고진영
선택 모델명
HyperCLOVAX-SEED-Text-Instruct-1.5B
Hugging Face
https://huggingface.co/naver-hyperclovax/HyperCLOVAX-SEED-Text-Instruct-1.5B

01모델 선택 이유

공공에서 추진 중인 AI 행정혁신·업무 자동화 과제는 한국어 행정문서·공문·민원의 처리 정확도가 핵심 요구사항이다. 이 관점에서 다음 세 가지 이유로 HyperCLOVA X SEED 1.5B Instruct를 선택하였다.

02모델 기본 정보

모델명HyperCLOVAX-SEED-Text-Instruct-1.5B
개발 주체NAVER (HyperCLOVAX Team) · 대한민국
모델 규모약 15억 (1.5B) 파라미터
라이선스HyperCLOVA X SEED License (월간 활성 사용자(MAU) 1천만 이하 서비스에 한해 상업적 이용 가능, 그 외에는 별도 라이선스 필요)
모델 유형Text Generation · Instruction-tuned (Chat)

03학습 데이터와 튜닝 방식

학습 데이터 · 사전학습은 2024년 8월 이전 공개 데이터를 기반으로 하며, 한국어·영어·일본어 등 다국어 고품질 텍스트와 코드를 포함한다. NAVER가 자체 보유한 한국 문화·언어 특화 데이터셋이 함께 사용되어 한국어 표현·관용 표현·문화 맥락 처리 능력이 강화되어 있다.

튜닝 방식 · Instruction-following 능력 확보를 위한 SFT(Supervised Fine-Tuning)를 중심으로, 사용자 선호 정렬을 위한 후처리(Preference Optimization 계열)가 적용되었다. 모델 카드의 사용 예시에서 JSON 출력·일상 대화체·번역 등 복합 지시를 처리하는 결과를 확인할 수 있다.

특징 · NAVER는 동일 시리즈 내에 0.5B / 1.5B / 3B(Vision 포함) 라인업을 함께 공개하여, 파인튜닝·도메인 특화 적용을 전제로 한 "기관 맞춤형 AI" 활용을 명시적 목표로 삼고 있다.

04파라미터 및 구조적 특징

ArchitectureTransformer 기반 Dense Decoder-Only 모델 (Llama 계열)
Context Length최대 16,384 tokens (16K)
Hidden Size약 1,920 (config.json hidden_size 참조)
Layers약 24개 Transformer Block
Attention Heads약 16 (Multi-head Attention)
TokenizerHyperCLOVA X 전용 Tokenizer (한국어 최적화 어휘 구성)

05모델 파일 구성

Hugging Face Repository에 게시된 주요 파일과 그 의미는 다음과 같다.

06활용 가능 업무

세종시교육청을 비롯한 시·도 교육청 단위에서 즉시 검토 가능한 활용 시나리오는 다음과 같다.

07한계와 주의사항

08종합 의견

HyperCLOVA X SEED 1.5B Instruct는 세종시교육청과 같은 한국 공공기관이 첫 SLM 도입을 검토할 때 가장 균형 잡힌 선택지이다. 한국어 성능·라이선스 자유도·하드웨어 요구사항의 세 축이 모두 공공 도입 기준선을 통과하는 거의 유일한 1.5B급 모델이라는 점에서 차별성이 있다.

다만 모델 자체로 완성된 솔루션은 아니며, RAG 파이프라인 + 도메인 파인튜닝과 결합해야 실질 가치가 나온다. AI 전문인재 과정에서 학습할 RAG·파인튜닝 기법을 이 모델에 적용해보는 것이 이후 회차 과제에서 자연스러운 연결고리가 된다.

09참고 링크