Alpha v0.0.1

Playground

OpenAI 호환 엔드포인트로 모델을 호출하고 OpenToken 게이트웨이를 통해 응답을 실시간으로 스트리밍합니다.

0.0 – 2.0
켜짐 = 토큰 단위 SSE, 꺼짐 = 전체 응답을 한 번에
시스템 프롬프트를 캐싱(Gemini CachedContent)하여 반복 호출 시 저렴하게 재사용합니다. 큰 시스템 프롬프트(약 4k 토큰 이상)에서만 적용됩니다.
실시간
호출은 OpenToken 게이트웨이의 /v1/chat/completions로 전송됩니다 — 토큰 단위로 스트리밍됨.
프롬프트를 실행하면 실시간 응답이 표시됩니다.
bash
curl https://api.opentoken.kr/v1/chat/completions \
  -H "Authorization: Bearer $OPENTOKEN_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic/claude-haiku-4-5",
    "stream": true,
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Say the single word: pong"}
    ],
    "temperature": 0.7
  }'