What does this reranking calculator estimate?

It compares baseline and candidate rerank depth and reports reranking cost delta, total unit-cost delta, and break-even impact for a retrieval-heavy workflow.

Should I always rerank more documents for better quality?

No. Use this output to quantify the cost tradeoff, then validate quality gains on sampled traffic before increasing rerank depth.

Reranking Cost Calculator

Pricing snapshot: 2026-07-20Provider: OpenAIModel: GPT-5 Mini

Step 1 Provider and Model

ProvideriModeli

Step 2 Quick Mode

Use-case preseti

Check whether a narrower rerank set can preserve quality before changing models.

Requests per user / monthiExpected user activity each month.Base prompt tokens / requestiNon-retrieval prompt tokens before chunk context.Output tokens / requestiAverage response length per request.Price per user / month (USD)iCurrent list price for margin context.Monthly active usersiUsed for monthly impact context in results.

Optional Advanced assumptions

Show advanced inputs

Baseline rerank docs / requestiCandidate rerank docs / requestiDocs scored by the reranker in the candidate plan.Retrieved chunks / requestiAverage chunk count in retrieved context.Tokens per chunkiAverage chunk size in tokens.Embedding ingestion tokens / monthiMonthly corpus updates re-embedded.Vector queries / requestiVector DB lookups each request.Vector cost / query (USD)iAverage per-query vector DB cost.Infra cost / request (USD)iNon-model compute/network overhead.Cache hit rate (0 to 0.99)iShare of requests served from cache.

Scenario actions

Copy scenario URL

Paste into ChatGPT or Claude, or share with a teammate.

Save and track this scenario

Track pricing drift on this scenario and get an email if the latest result changes.

How tracking works

After you click Save and track, we carry this exact calculator state into the tracked-scenarios page so you can sign in and confirm the save.

We save your assumptions and the pricing snapshot used for this result.

When a newer pricing snapshot lands, we recompute the same scenario, show what changed, and email you if the latest result moved.

1 tracked scenario free, then $12/mo or $120/yr for up to 25 tracked scenarios.

Headline metric

Candidate rerank plan lowers cost

Total cost delta per user / month: $-0.72

Candidate rerank docs / request: 20 vs baseline 28. Reranking cost / request: $0.02 vs baseline $0.028.

Cost delta / user / month

$-0.72

Reranking cost delta

$-0.96

Break-even delta

$-0.72

Monthly cost delta

$-468

Totals

Cost per request

Baseline: $0.02227
Candidate: $0.01627
Delta: -$0.006

Cost per user/month

Baseline: $2.6726
Candidate: $1.9526
Delta: -$0.72

Gross margin %

Baseline: 94.5%
Candidate: 96.0%
Delta: +1.5%

Break-even price

Baseline: $2.6726
Candidate: $1.9526
Delta: -$0.72

Metric	Baseline	Candidate	Delta
Cost per request	$0.02227	$0.01627	-$0.006
Cost per user/month	$2.6726	$1.9526	-$0.72
Gross margin %	94.5%	96.0%	+1.5%
Break-even price	$2.6726	$1.9526	-$0.72

Component Breakdown

Generationi

Baseline: $0.114
Candidate: $0.114
Delta: $0

Retrievali

Baseline: $0.0396
Candidate: $0.0396
Delta: $0

Rerankingi

Baseline: $3.36
Candidate: $2.4
Delta: -$0.96

Embeddings Ingestioni

Baseline: $0
Candidate: $0
Delta: $0

Vector Dbi

Baseline: $0.0018
Candidate: $0.0018
Delta: $0

Cachei

Baseline: $-0.8908
Candidate: $-0.6508
Delta: +$0.24

Infrai

Baseline: $0.048
Candidate: $0.048
Delta: $0

Component	Baseline	Candidate	Delta
Generationi	$0.114	$0.114	$0
Retrievali	$0.0396	$0.0396	$0
Rerankingi	$3.36	$2.4	-$0.96
Embeddings Ingestioni	$0	$0	$0
Vector Dbi	$0.0018	$0.0018	$0
Cachei	$-0.8908	$-0.6508	+$0.24
Infrai	$0.048	$0.048	$0

Sensitivity Rankingi

Variable	Cost delta %
Requests Per User Monthi	10.00%
Rerank Docsi	9.22%
Cache Hit Ratei	-3.33%
Output Tokensi	0.32%
Retrieved Chunksi	0.15%
Tokens Per Chunki	0.15%
Input Tokensi	0.12%
Vector Queries Per Requesti	0.01%
Monthly Active Usersi	-0.00%

Assumptions and Units

CurrencyUSD
Token unittoken
Rerank unitdocuments scored per request
Pricing snapshot2026-07-20
Selected model rowOpenAI/GPT-5 Mini
Comparison ruleOnly rerank depth changes; non-rerank inputs stay shared

Recommended Next Step

Validate retrieval quality and infra assumptions before increasing rerank depth on live traffic.

Reranking references

What Is Reranking in RAG?RAG Cost Components Explained

Compare infra providers

View Infra Recommendations

Sources and Snapshot

Active Pricing Row

Candidate

OpenAI / GPT-5 Mini

Input tokens$0.25 / 1M
Output tokens$2 / 1M

Shared retrieval defaults

Embedding input$0.02 / 1M
Rerank docs$1 / 1K

Snapshot date: 2026-07-20
Source links and update notes: Pricing Snapshot Reference

Continue Analysis

Switch tools

Read guides

Rerank Cost

How It Works

Formula

Assumptions and Units

Step 1 Provider and Model

Step 2 Quick Mode

Optional Advanced assumptions

Scenario actions

Copy scenario URL

Save and track this scenario

Headline metric

Totals

Component Breakdown

Assumptions and Units

Recommended Next Step

Sources and Snapshot

Continue Analysis