
Kimi K2.6은 Moonshot AI가 공개한 오픈소스 멀티모달 에이전트 모델로, 텍스트와 함께 이미지·영상을 처리할 수 있습니다. 장기 코딩과 코드 기반 디자인, 자율 에이전트 구동에 특화되어 있으며, 깊게 추론하는 Thinking 모드와 빠르게 응답하는 Instant 모드를 골라 쓸 수 있습니다. OpenAI·Anthropic 호환 API로 호출합니다.
구분 | 내용 |
|---|---|
제공자 | |
종류 | Image·Video·Text → Text |
아키텍처 | MoE (Experts 384, top-8) + MoonViT vision encoder |
파라미터 | 1T total / 32B active |
컨텍스트 | 256K tokens |
입력 / 출력 | Text·Image·Video / Text |
모드 | Thinking / Instant |
인터페이스 | OpenAI·Anthropic 호환 |
라이선스 | Modified MIT (상업적 이용 가능) |
주요 벤치마크에서 GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro 같은 최상위 모델과 견줄 만한 성능을 자랑합니다.
특히 코딩(SWE-Bench Pro 58.6)과 검색(DeepSearchQA accuracy 83.0)에서 우위를 차지했으며, 수학 추론(AIME 2026 96.4)과 과학 지식(GPQA-Diamond 90.5)에서도 높은 점수를 기록했습니다.

벤치마크 | Kimi-K2.6 | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|---|
HLE-Full (도구 사용) | 54.0 | 52.1 | 53.0 | 51.4 |
DeepSearchQA (정확도) | 83.0 | 63.7 | 80.6 | 60.2 |
SWE-Bench Verified | 80.2 | – | 80.8 | 80.6 |
LiveCodeBench (v6) | 89.6 | – | 88.8 | 91.7 |
Terminal-Bench 2.0 | 66.7 | 65.4 | 65.4 | 68.5 |
AIME 2026 | 96.4 | 99.2 | 96.7 | 98.3 |
GPQA-Diamond | 90.5 | 92.8 | 91.3 | 94.3 |
MMMU-Pro (비전) | 79.4 | 81.2 | 73.9 | 83.0 |
복잡한 인프라 구성 없이 엘리스클라우드 ML API로 Kimi K2.6을 바로 호출할 수 있습니다.
|
|
|
|
신규 모델 상시 추가 | 인프라 관리 불필요 | 원화 결제 | 엘리스클라우드 GPU 연동 |
검증된 최신 오픈소스 모델 상시로 업데이트 | 서버·GPU 세팅 없이 API 호출만으로 즉시 사용 | 환율 걱정없이 원화로 간편하게 결제 | 전용 자원 혹은 파인튜닝이 필요한 경우 엘리스클라우드 GPU 즉시 연동 |
from openai import OpenAI
client = OpenAI(base_url="YOUR_ENDPOINT_URL", api_key="YOUR_API_KEY")
# 멀티모달 입력 (text + image)
resp = client.chat.completions.create(
model="<MODEL_ID>", # 엘리스 ML API 모델 ID
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "이 화면을 React 컴포넌트로 만들어 줘."},
{"type": "image_url", "image_url": {"url": "https://example.com/design.png"}},
],
}],
max_tokens=8192,
)
print(resp.choices[0].message.content)
# Instant 모드 (빠른 응답)
resp = client.chat.completions.create(
model="<MODEL_ID>",
messages=[{"role": "user", "content": "한 줄로 요약해 줘."}],
extra_body={"chat_template_kwargs": {"thinking": False}},
)
모델 제공자
moonshotai
모델 종류
Text Generation
사용 방식 및 요금
Serverless
₩1,520/1M input tokens
₩6,400/1M output tokens
Dedicated
모델 ID
nvidia/Kimi-K2.6-NVFP4