Back to Article List

How to fix Hermes "no inference provider configured" error

How to fix Hermes

You install Hermes Agent, you try to chat, and the response is:

no inference provider configured. run 'hermes model' to choose a provider

This is the second most common post-install error (the first is hermes command not found). The agent needs an LLM provider to talk to. The install doesn't ship with one pre-selected on purpose.

Why Hermes doesn't have a default provider

Hermes supports many providers: Anthropic, OpenAI, OpenRouter, Nous Portal, Gemini, xAI, Qwen, MiniMax, Hugging Face, Groq, plus any local OpenAI-compatible endpoint like Ollama or LM Studio. None of these are obvious defaults. Picking one for you would mean pushing every user toward one vendor. So Hermes asks on first use.

If you skipped the wizard during install (or wiped ~/.hermes and reinstalled), the provider config is empty. Every chat request hits the inference layer, finds no provider, returns the error.

The fix in three commands

hermes model
# pick a provider, paste your API key when prompted
hermes doctor
hermes chat -q "say ok"

The hermes model command walks you through provider selection, model choice and key entry in one flow. hermes doctor confirms the config wrote correctly. The smoke test verifies the round trip works end to end.

Which provider should I pick?

The wizard doesn't tell you. Here is my opinion based on running Hermes for several months across different projects.

Anthropic direct

Best general agent performance. Claude Sonnet 4.6 is what I use for most work. The API is reliable, auth is simple, tool calls land cleanly. Downside: not the cheapest option.

OpenRouter

One API key, hundreds of models behind it. Good if you want to swap models per task without separate accounts. Setup is slightly more complex (you pick a default model from the catalog). See OpenRouter docs for account setup.

Nous Portal

Uses the same Nous-hosted models that power Hermes's OpenRouter ranking. Often cheaper than direct Anthropic for some use cases.

Local through Ollama or LM Studio

Zero per-token cost. The catch: you need a machine with enough VRAM. A 32B-class local model is competent for simple chat and noticeably worse than a hosted Sonnet on complex tool-heavy work. Hybrid is the practical answer: cheap local for chat, hosted for tool tasks.

Token cost trade-offs in more depth in our cut Hermes token costs guide.

What the Hermes model wizard does

Behind the scenes, four steps:

  1. Writes provider choice to config
  2. Saves API key (to auth.json or as env var, your choice)
  3. Picks a default model from the provider's catalog
  4. Runs a validation request to confirm the key works

If any step fails, the wizard tells you which one. Usually it's step 4 (validation): typo in the key, or you pasted a key from a different provider by mistake.

When Hermes model command doesn't exist

Older Hermes versions used hermes provider or hermes inference set instead. If hermes model errors with "command not found", you're on an older release:

hermes upgrade
hermes --version

You want at least v0.10 for the unified wizard. Check the Hermes releases page for current versions.

Wizard runs but agent still says no provider...

Two possibilities from what I've found:

Possibility 1: Wizard wrote to a different config than the agent reads

Happens with encrypted home directories, weird path setups, or installs spanning multiple users. Check:

echo $HOME
ls -la ~/.hermes/
hermes config show | head -30

If ~/.hermes is missing or owned by the wrong user, that's the issue.

Possibility 2: You configured as one user, gateway runs as another

Classic case. You ran hermes model as your normal user. The gateway runs as root through systemd. Root has no ~/.hermes, so the agent starts fresh with no provider.

Two fixes:

# Fix A: change systemd unit to run as your user
sudo systemctl edit hermes-gateway
# add: [Service]
#      User=youruser

# Fix B: copy the config across
sudo cp -r ~/.hermes /root/.hermes
sudo chown -R root:root /root/.hermes

Fix A is the proper way. Our Hermes systemd setup shows the correct unit format.

Changing the model after setting the provider

The wizard picks a sensible default model. If you want a different one:

hermes model list
hermes model set anthropic/claude-sonnet-4-6

For OpenRouter: openrouter/model-id as listed in OpenRouter catalog. For Ollama: ollama/model-name (the local model name).

Always run hermes doctor after provider config

Don't skip this. Doctor checks provider connection, model availability, network, Python, disk permissions. If something else is wrong you find out now instead of discovering each issue one at a time during chat.

hermes doctor

If chat throws 401 right after wizard says key was valid

This is rare but real. The wizard validated, the key got mangled before reaching the inference call. Common with very long keys (some providers issue 200+ character keys) and shells that wrap or escape strangely.

Reset the key:

hermes auth set anthropic

Paste directly into the prompt, don't echo from a variable. If 401 persists, see our Hermes 401 auth errors tutorial.

LumaDock template with pre-configured provider setup

The Hermes Agent template on LumaDock includes a guided provider setup on first SSH login. You enter the key, the wizard validates, you chat. Unmetered bandwidth, no setup fees. The provider wizard is the same one you'd run manually. The template just walks it for you. Full setup in our Hermes Agent complete guide.

Your idea deserves better hosting

24/7 support 30-day money-back guarantee Cancel anytime
Platební období

1 GB RAM VPS

$3.99 Save  25 %
$2.99 Měsíčně
  • 1 vCPU AMD EPYC
  • 30 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Správa firewallu
  • Monitorování serveru zdarma

2 GB RAM VPS

$5.99 Save  17 %
$4.99 Měsíčně
  • 2 vCPU AMD EPYC
  • 30 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Správa firewallu
  • Monitorování serveru zdarma

6 GB RAM VPS

$14.99 Save  33 %
$9.99 Měsíčně
  • 6 vCPU AMD EPYC
  • 70 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Správa firewallu
  • Monitorování serveru zdarma

AMD EPYC VPS.P1

$7.99 Save  25 %
$5.99 Měsíčně
  • 2 vCPU AMD EPYC
  • 4 GB RAM paměť
  • 40 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

AMD EPYC VPS.P2

$14.99 Save  27 %
$10.99 Měsíčně
  • 2 vCPU AMD EPYC
  • 8 GB RAM paměť
  • 80 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

AMD EPYC VPS.P4

$29.99 Save  20 %
$23.99 Měsíčně
  • 4 vCPU AMD EPYC
  • 16 GB RAM paměť
  • 160 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

AMD EPYC VPS.P5

$36.49 Save  21 %
$28.99 Měsíčně
  • 8 vCPU AMD EPYC
  • 16 GB RAM paměť
  • 180 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

AMD EPYC VPS.P6

$56.99 Save  21 %
$44.99 Měsíčně
  • 8 vCPU AMD EPYC
  • 32 GB RAM paměť
  • 200 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

AMD EPYC VPS.P7

$69.99 Save  20 %
$55.99 Měsíčně
  • 16 vCPU AMD EPYC
  • 32 GB RAM paměť
  • 240 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

EPYC Genoa VPS.G1

$4.99 Save  20 %
$3.99 Měsíčně
  • 1 vCPU AMD EPYC Gen4 AMD EPYC Genoa 4. generace 9xx4 s 3,25 GHz nebo podobným výkonem, založený na architektuře Zen 4.
  • 1 GB DDR5 RAM paměť
  • 25 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

EPYC Genoa VPS.G2

$12.99 Save  23 %
$9.99 Měsíčně
  • 2 vCPU AMD EPYC Gen4 AMD EPYC Genoa 4. generace 9xx4 s 3,25 GHz nebo podobným výkonem, založený na architektuře Zen 4.
  • 4 GB DDR5 RAM paměť
  • 50 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

EPYC Genoa VPS.G4

$25.99 Save  27 %
$18.99 Měsíčně
  • 4 vCPU AMD EPYC Gen4 AMD EPYC Genoa 4. generace 9xx4 s 3,25 GHz nebo podobným výkonem, založený na architektuře Zen 4.
  • 8 GB DDR5 RAM paměť
  • 100 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

EPYC Genoa VPS.G6

$48.99 Save  31 %
$33.99 Měsíčně
  • 8 vCPU AMD EPYC Gen4 AMD EPYC Genoa 4. generace 9xx4 s 3,25 GHz nebo podobným výkonem, založený na architektuře Zen 4.
  • 16 GB DDR5 RAM paměť
  • 200 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

EPYC Genoa VPS.G7

$74.99 Save  27 %
$54.99 Měsíčně
  • 8 vCPU AMD EPYC Gen4 AMD EPYC Genoa 4. generace 9xx4 s 3,25 GHz nebo podobným výkonem, založený na architektuře Zen 4.
  • 32 GB DDR5 RAM paměť
  • 250 GB NVMe úložiště
  • Neomezený přenos dat
  • IPv4 a IPv6 v ceně Podpora IPv6 momentálně není dostupná ve Francii, Finsku a Nizozemsku.
  • 1 Gbps síť
  • Automatická záloha v ceně
  • Správa firewallu
  • Monitorování serveru zdarma

AMD Ryzen VPS.R1

$15.99 Save  31 %
$10.99 Měsíčně
  • 1 dedikované CPU AMD Ryzen 9 7950X s 4,5 GHz nebo podobný, na architektuře Zen 4. vCPU
  • 4 GB DDR5PAMĚŤ
  • 50 GB NVMeÚLOŽIŠTĚ
  • Neměřený provoz
  • IPv4 & IPv6 v ceně Podpora IPv6 není aktuálně dostupná ve Francii, Finsku ani Nizozemsku.
  • Auto zálohy v ceně

AMD Ryzen VPS.R2

$27.99 Save  21 %
$21.99 Měsíčně
  • 2 dedikovaná CPU AMD Ryzen 9 7950X s 4,5 GHz nebo podobný, na architektuře Zen 4. vCPU
  • 8 GB DDR5PAMĚŤ
  • 100 GB NVMeÚLOŽIŠTĚ
  • Neměřený provoz
  • IPv4 & IPv6 v ceně Podpora IPv6 není aktuálně dostupná ve Francii, Finsku ani Nizozemsku.
  • Auto zálohy v ceně

AMD Ryzen VPS.R4

$99.99 Save  20 %
$79.99 Měsíčně
  • 8 dedikovaná CPU AMD Ryzen 9 7950X s 4,5 GHz nebo podobný, na architektuře Zen 4. vCPU
  • 32 GB DDR5PAMĚŤ
  • 400 GB NVMeÚLOŽIŠTĚ
  • Neměřený provoz
  • IPv4 & IPv6 v ceně Podpora IPv6 není aktuálně dostupná ve Francii, Finsku ani Nizozemsku.
  • Auto zálohy v ceně

Frequently asked questions

Which provider should I configure for Hermes Agent?

Anthropic direct for best general agent performance. OpenRouter if you want flexibility to swap models. Nous Portal for cheaper Nous-hosted models. Ollama if you want zero per-token cost with a local model.

Your agent runs wild. Your bill doesn't.

Easily deploy Hermes in one click on Ubuntu 24.04 with AMD EPYC, NVMe storage and unmetered bandwidth. The price stays the same whatever the agent does, no setup fees, no overage charges and no tier traps.

GPU products are in high demand at the moment. Fill the form to get notified as soon as your preferred GPU server is back in stock.