NL EN Demo boeken Inloggen Aan de slag

Model garden

Llama 4 Maverick 17B 128E

Name: Llama 4 Maverick 17B 128E hosting (EU)
Brand: HostYourAI
Price: 0.40 EUR
Availability: InStock

Direct via de EU-router of als dedicated GPU-deployment. Data blijft in Europa.

Llama 4 Maverick 17B 128E is een multimodaal taalmodel van Meta met 402B parameters, gehost op Europese GPU's via een OpenAI-compatibele API.

Start gratis ← Alle modellen

meta-llama/Llama-4-Maverick-17B-128E

text+image->text · meta-llama · EU-hosted

402B

Parameters

—

Contextvenster

924GB

Minimale VRAM

POST /api/v1/chat/completions200 OK

Specificaties

Parameters 402B

Minimale VRAM 924 GB

Architectuur Llama4ForConditionalGeneration (vLLM)

Licentie other

Modaliteit text+image->text

Uitgebracht April 2025

Uitgever meta-llama ↗

Prijzen

€0.40

Input (per 1M tokens)

€0.60

Output (per 1M tokens)

Gedeelde EU-router, pay-per-token, scale-to-zero. Dedicated GPU-deployments worden per uur afgerekend — zie prijzen.

Direct aanroepen

Drop-in vervanger voor OpenAI: wijzig alleen de base-URL en de API-key. Ook het Anthropic-formaat (/v1/messages) wordt ondersteund.

curl https://hostyourai.com/api/v1/chat/completions \
  -H "Authorization: Bearer hyai-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "meta-llama/Llama-4-Maverick-17B-128E",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Veelgestelde vragen

Kan ik Llama 4 Maverick 17B 128E in de EU draaien?

Ja. HostYourAI draait Llama 4 Maverick 17B 128E op GPU's in Europese datacenters via vLLM. Prompts en outputs verlaten de EU niet en er is geen Amerikaanse cloudprovider in de keten.

Is Llama 4 Maverick 17B 128E hosten AVG/GDPR-compliant?

Ja. Alle verwerking vindt plaats binnen de EU, er is een verwerkersovereenkomst (DPA) beschikbaar en de subprocessor-lijst is openbaar. Open-source gewichten betekenen ook: geen training op jouw data.

Wat kost Llama 4 Maverick 17B 128E?

Via de gedeelde EU-router betaal je €0.40 per miljoen input-tokens en €0.60 per miljoen output-tokens, zonder vaste kosten. Voor hoge volumes of isolatie kun je Llama 4 Maverick 17B 128E ook als dedicated GPU-instance per uur draaien.

Is de API compatibel met OpenAI?

Ja. Je gebruikt de standaard OpenAI-SDK's met een aangepaste base-URL (https://hostyourai.com/api/v1). Ook de Anthropic Messages API wordt ondersteund als drop-in.

Andere modellen van Meta

Llama Guard 4 12B

Llama Guard 4 12B is een multimodaal taalmodel van Meta met 12B parameters, gehost op Europese GPU's via een OpenAI-compatibele API.

12B Bekijk model →

Llama 4 Scout 17B 16E

Llama 4 Scout 17B 16E is een multimodaal taalmodel van Meta met 109B parameters, gehost op Europese GPU's via een OpenAI-compatibele API.

109B Bekijk model →

Llama 4 Scout 17B 16E Instruct

Llama 4 Scout 17B 16E Instruct is een multimodaal taalmodel van Meta met 109B parameters, gehost op Europese GPU's via een OpenAI-compatibele API.

109B Bekijk model →

Llama 4 Maverick 17B 128E Instruct

Llama 4 Maverick 17B 128E Instruct is een multimodaal taalmodel van Meta met 402B parameters, gehost op Europese GPU's via een OpenAI-compatibele API.

402B Bekijk model →

Llama 4 Maverick 17B 128E Instruct FP8

Llama 4 Maverick 17B 128E Instruct FP8 is een multimodaal taalmodel van Meta met 402B parameters, gehost op Europese GPU's via een OpenAI-compatibele API.

402B Bekijk model →

Llama 3.3 70B Instruct

Llama 3.3 70B Instruct is een open-source taalmodel van Meta met 71B parameters, gehost op Europese GPU's via een OpenAI-compatibele API.

71B Bekijk model →

Probeer Llama 4 Maverick 17B 128E gratis

Account aanmaken duurt een minuut. Test Llama 4 Maverick 17B 128E direct in de playground.

Start gratis