Міркування - це модальність
Корпус абстракції та міркування (ARC) забезпечує компактну лабораторію для вивчення абстрактних міркувань, здатності центральної для людського інтелекту. Сучасні системи штучного інтелекту, включаючи LLM та VIT, значною мірою працюють як машини прогнозування послідовності поведінки: вони відповідають спостережуваній поведінці шляхом моделювання статистики токенів без стійкого, читабельного психічного стану. Це створює розрив у поведінці, подібній до людини: люди можуть пояснити дію, розшифровуючи внутрішній стан, тоді як системи штучного інтелекту можуть виробляти вільні пост-хок-раціоналізації, які не ґрунтуються на такому стані. Ми висуваємо гіпотезу, що міркування є модальністю: міркування повинно існувати як окремий канал, відокремлений від робочого простору низького рівня, до якого застосовуються правила. Щоб перевірити цю гіпотезу, вирішуючи завдання ARC як проблеми візуального міркування, ми розробили новий блок трансформатора, розділений ролями, який розділяє токени глобального контролера від токенів робочого простору сітки, що дозволяє ітераційне виконання правил. Навчений та оцінений у рамках протоколу VARC, орієнтованого на зір, наш метод досяг точності 62,6% на ARC-1, перевершивши середню продуктивність людини (60,2%) та значно перевершивши попередні методи. Якісно наші моделі демонструють більш узгоджену структуру застосування правил, ніж щільна базова лінія ViT, що відповідає зміщенню від правдоподібних краплин ймовірності до міркувань, керованих контролером.
At a glance
- Source
- arXiv
- Published
- Jan 19, 2026
- Read time
- 1 min read
- Primary lane
- AI
Quick read
1 bullets- Корпус абстракції та міркування (ARC) забезпечує компактну лабораторію для вивчення абстрактних міркувань, здатності центральної для людського інтелекту. Сучасні системи штучного інтелекту, включаючи LLM та VIT, значною мірою працюють як машини прогнозування послідовності поведінки: вони відповідають спостережуваній поведінці шляхом моделювання статистики токенів без стійкого, читабельного психічного стану. Це створює розрив у поведінці, подібній до людини: люди можуть пояснити дію, розшифровуючи внутрішній стан, тоді як системи штучного інтелекту можуть виробляти вільні пост-хок-раціоналізації, які не ґрунтуються на такому стані. Ми висуваємо гіпотезу, що міркування є модальністю: міркування повинно існувати як окремий канал, відокремлений від робочого простору низького рівня, до якого застосовуються правила. Щоб перевірити цю гіпотезу, вирішуючи завдання ARC як проблеми візуального міркування, ми розробили новий блок трансформатора, розділений ролями, який розділяє токени глобального контролера від токенів робочого простору сітки, що дозволяє ітераційне виконання правил. Навчений та оцінений у рамках протоколу VARC, орієнтованого на зір, наш метод досяг точності 62,6% на ARC-1, перевершивши середню продуктивність людини (60,2%) та значно перевершивши попередні методи. Якісно наші моделі демонструють більш узгоджену структуру застосування правил, ніж щільна базова лінія ViT, що відповідає зміщенню від правдоподібних краплин ймовірності до міркувань, керованих контролером.
Чому це важливо
Корпус абстракції та міркування (ARC) забезпечує компактну лабораторію для вивчення абстрактних міркувань, здатності центральної для людського інтелекту. Сучасні системи штучного інтелекту, включаючи LLM та VIT, значною мірою працюють як машини прогнозування послідовності поведінки: вони відповідають спостережуваній поведінці шляхом моделювання статистики токенів без стійкого, читабельного психічного стану. Це створює розрив у поведінці, подібній до людини: люди можуть пояснити дію, розшифровуючи внутрішній стан, тоді як системи штучного інтелекту можуть виробляти вільні пост-хок-раціоналізації, які не ґрунтуються на такому стані. Ми висуваємо гіпотезу, що міркування є модальністю: міркування повинно існувати як окремий канал, відокремлений від робочого простору низького рівня, до якого застосовуються правила. Щоб перевірити цю гіпотезу, вирішуючи завдання ARC як проблеми візуального міркування, ми розробили новий блок трансформатора, розділений ролями, який розділяє токени глобального контролера від токенів робочого простору сітки, що дозволяє ітераційне виконання правил. Навчений та оцінений у рамках протоколу VARC, орієнтованого на зір, наш метод досяг точності 62,6% на ARC-1, перевершивши середню продуктивність людини (60,2%) та значно перевершивши попередні методи. Якісно наші моделі демонструють більш узгоджену структуру застосування правил, ніж щільна базова лінія ViT, що відповідає зміщенню від правдоподібних краплин ймовірності до міркувань, керованих контролером.
Builder takeaway
arXiv published this update in the AI lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.
Корпус абстракції та міркування (ARC) забезпечує компактну лабораторію для вивчення абстрактних міркувань, здатності центральної для людського інтелекту. Сучасні системи штучного інтелекту, включаючи LLM та VIT, значною мірою працюють як машини прогнозування послідовності поведінки: вони відповідають спостережуваній поведінці шляхом моделювання статистики токенів без стійкого, читабельного психічного стану. Це створює розрив у поведінці, подібній до людини: люди можуть пояснити дію, розшифровуючи внутрішній стан, тоді як системи штучного інтелекту можуть виробляти вільні пост-хок-раціоналізації, які не ґрунтуються на такому стані. Ми висуваємо гіпотезу, що міркування є модальністю: міркування повинно існувати як окремий канал, відокремлений від робочого простору низького рівня, до якого застосовуються правила. Щоб перевірити цю гіпотезу, вирішуючи завдання ARC як проблеми візуального міркування, ми розробили новий блок трансформатора, розділений ролями, який розділяє токени глобального контролера від токенів робочого простору сітки, що дозволяє ітераційне виконання правил. Навчений та оцінений у рамках протоколу VARC, орієнтованого на зір, наш метод досяг точності 62,6% на ARC-1, перевершивши середню продуктивність людини (60,2%) та значно перевершивши попередні методи. Якісно наші моделі демонструють більш узгоджену структуру застосування правил, ніж щільна базова лінія ViT, що відповідає зміщенню від правдоподібних краплин ймовірності до міркувань, керованих контролером.
Stay ahead with daily AI briefings
Follow the feed, share the briefing, or jump back into the archive.