AI Model Leaderboard

Benchmark scores across leading AI models. Click column headers to sort.

Benchmark:14 results

Rank ↕	Model ↕	Company ↕	Benchmark ↕	Score ↓
—	Gemini 3.1 Pro	Google DeepMind	GPQA	94.3
—	GPT-5.5	OpenAI	GPQA	93.5
1	Claude Opus 4.7	Anthropic	GPQA	93.1
—	Claude Fable 5	Anthropic	GPQA	92.6
2	Claude Opus 4.6	Anthropic	GPQA	92.5
10	GPT-5.4 Thinking	OpenAI	GPQA	92.0
—	Claude Opus 4.8	Anthropic	GPQA	91.0
—	Grok 4.3	xAI	GPQA	90.1
—	Muse Spark	Meta AI	GPQA	89.5
6	Gemini 2.5 Flash	Google DeepMind	GPQA	89.0
7	Llama 3.2 405B	Meta AI	GPQA	88.8
—	DeepSeek-V3.2	—	GPQA	82.4
—	Claude Sonnet 4.6	Anthropic	GPQA	80.0
—	GPT-4o	OpenAI	GPQA	55.1