OpenAI

GPT-5.2 для науки та математики

GPT-5.2 Pro та GPT-5.2 Thinking орієнтовані на математичні й наукові задачі та демонструють провідні результати на GPQA Diamond і FrontierMath.

OpenAI||1 min read
Open original

At a glance

Source
OpenAI
Published
Dec 10, 2025
Read time
1 min read
Primary lane
GPT-5.2

Quick read

4 bullets
  • GPT-5.2 Pro та GPT-5.2 Thinking орієнтовані на математичні й наукові задачі та демонструють провідні результати на GPQA Diamond і FrontierMath.
  • Основний акцент зроблено на точному багатокроковому міркуванні для надійних наукових workflow, зокрема програмування, аналізу даних і експериментального дизайну.
  • Кейс: GPT-5.2 Pro побудував доведення, яке розв’язало відкрите питання про монотонність кривих навчання для оцінок максимальної правдоподібності; люди перевірили й розширили результат.
  • Перспектива: frontier-моделі можуть прискорювати дослідницький пошук, але людське судження та перевірка залишаються критично важливими.

Чому це важливо

Коротко

Builder takeaway

OpenAI published this update in the GPT-5.2 lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

Коротко

- GPT-5.2 Pro та GPT-5.2 Thinking орієнтовані на математичні й наукові задачі та демонструють провідні результати на GPQA Diamond і FrontierMath.

- Основний акцент зроблено на точному багатокроковому міркуванні для надійних наукових workflow, зокрема програмування, аналізу даних і експериментального дизайну.

- Кейс: GPT-5.2 Pro побудував доведення, яке розв’язало відкрите питання про монотонність кривих навчання для оцінок максимальної правдоподібності; люди перевірили й розширили результат.

- Перспектива: frontier-моделі можуть прискорювати дослідницький пошук, але людське судження та перевірка залишаються критично важливими.

GPT-5.2 позиціонується як найсильніша модель OpenAI для наукових і математичних задач на сьогодні. У релізі підкреслюються покращення в точному багатокроковому міркуванні, що зменшує кількість помилок у симуляціях, статистиці, прогнозуванні та моделюванні. OpenAI вважає, що ці досягнення свідчать про ширшу та переносну здатність до міркування, релевантну для прогресу до AGI.

На GPQA Diamond — науковому бенчмарку рівня магістратури та PhD без використання інструментів — GPT-5.2 Pro набирає 93.2%, а GPT-5.2 Thinking — 92.4%. На FrontierMath (рівні 1–3) GPT-5.2 Thinking встановлює новий state of the art, розв’язуючи 40.3% математичних задач експертного рівня з увімкненими код-інструментами.

Детальний кейс описує, як GPT-5.2 Pro розв’язав відкрите питання про те, чи залишаються криві навчання для оцінок максимальної правдоподібності монотонними зі збільшенням обсягу даних. Модель згенерувала повне доведення, яке експерти-люди перевірили та узагальнили на багатовимірні випадки й інші статистичні моделі. Люди зосередилися на перевірці коректності та чіткому викладі, а не на побудові каркасу доведення.

Стаття подає GPT-5.2 як дослідницького асистента, здатного пропонувати детальні аргументи й гіпотези, водночас залишаючи за людьми відповідальність за перевірку припущень, коректності та контексту предметної області. Пропонуються workflow, що поєднують міркування, згенеровані моделлю, з суворим людським контролем для прискорення теоретичного й наукового прогресу.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.