Model garden

DeepSeek OCR 2

Direct via de EU-router of als dedicated GPU-deployment. Data blijft in Europa.

Inference using Huggingface transformers on NVIDIA GPUs. Requirements tested on python 3.12.9 + CUDA11.8:

deepseek-ai/DeepSeek-OCR-2 vLLM ready
text+image->text · deepseek-ai · EU-hosted
3.4B
Parameters
8K
Contextvenster
8GB
Minimale VRAM
POST /api/v1/chat/completions200 OK

Specificaties

Parameters 3.4B
Contextvenster 8,192 tokens
Minimale VRAM 8 GB
Architectuur DeepseekOCR2ForCausalLM (vLLM)
Licentie apache-2.0
Modaliteit text+image->text
Uitgebracht January 2026
Uitgever deepseek-ai ↗

Prijzen

€0.03
Input (per 1M tokens)
€0.06
Output (per 1M tokens)

Gedeelde EU-router, pay-per-token, scale-to-zero. Dedicated GPU-deployments worden per uur afgerekend — zie prijzen.

✓ Werkend geverifieerd op 24-06-2026 — respons in 761 ms op onze EU-infrastructuur.

Direct aanroepen

Drop-in vervanger voor OpenAI: wijzig alleen de base-URL en de API-key. Ook het Anthropic-formaat (/v1/messages) wordt ondersteund.

curl https://hostyourai.com/api/v1/chat/completions \
  -H "Authorization: Bearer hyai-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-ai/DeepSeek-OCR-2",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Veelgestelde vragen

Kan ik DeepSeek OCR 2 in de EU draaien?

Ja. HostYourAI draait DeepSeek OCR 2 op GPU's in Europese datacenters via vLLM. Prompts en outputs verlaten de EU niet en er is geen Amerikaanse cloudprovider in de keten.

Is DeepSeek OCR 2 hosten AVG/GDPR-compliant?

Ja. Alle verwerking vindt plaats binnen de EU, er is een verwerkersovereenkomst (DPA) beschikbaar en de subprocessor-lijst is openbaar. Open-source gewichten betekenen ook: geen training op jouw data.

Wat kost DeepSeek OCR 2?

Via de gedeelde EU-router betaal je €0.03 per miljoen input-tokens en €0.06 per miljoen output-tokens, zonder vaste kosten. Voor hoge volumes of isolatie kun je DeepSeek OCR 2 ook als dedicated GPU-instance per uur draaien.

Is de API compatibel met OpenAI?

Ja. Je gebruikt de standaard OpenAI-SDK's met een aangepaste base-URL (https://hostyourai.com/api/v1). Ook de Anthropic Messages API wordt ondersteund als drop-in.

Andere modellen van DeepSeek

DeepSeek V4 Pro

We present a preview version of DeepSeek-V4 series, including two strong Mixture-of-Experts (MoE) language models — DeepSeek-V4-Pro with 1.6T parameters (49B activated) and DeepSeek-V4-Flash with 284B parameters (13B activated) — both supporting a context length of one million tokens.

862B 1M context Bekijk model →
DeepSeek V4 Flash

We present a preview version of DeepSeek-V4 series, including two strong Mixture-of-Experts (MoE) language models — DeepSeek-V4-Pro with 1.6T parameters (49B activated) and DeepSeek-V4-Flash with 284B parameters (13B activated) — both supporting a context length of one million tokens.

158B 1M context Bekijk model →
DeepSeek V3.2

We introduce DeepSeek-V3.2, a model that harmonizes high computational efficiency with superior reasoning and agent performance. Our approach is built upon three key technical breakthroughs:

685B 164K context Bekijk model →
DeepSeek OCR

torch==2.6.0 transformers==4.46.3 tokenizers==0.20.3 einops addict easydict pip install flash-attn==2.7.3 --no-build-isolation

3.3B 8K context Bekijk model →
DeepSeek V3.2 Exp

We are excited to announce the official release of DeepSeek-V3.2-Exp, an experimental version of our model. As an intermediate step toward our next-generation architecture, V3.2-Exp builds upon V3.1-Terminus by introducing DeepSeek Sparse Attention—a sparse attention mechanism designed to explore and validate optimizations for training and inference efficiency in long-context scenarios.

685B 164K context Bekijk model →
DeepSeek V3.1 Terminus

This update maintains the model's original capabilities while addressing issues reported by users, including:

685B 164K context Bekijk model →

Probeer DeepSeek OCR 2 gratis

Account aanmaken duurt een minuut. Test DeepSeek OCR 2 direct in de playground.

Start gratis