ViaFormer: трансформатор вирівнювання воксельних зображень для вдосконалення вокселів високої точності
Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.
At a glance
- Source
- arXiv
- Published
- Jan 20, 2026
- Read time
- 1 min read
- Primary lane
- Computer Vision
Quick read
1 bullets- Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.
Чому це важливо
Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.
Builder takeaway
arXiv published this update in the Computer Vision lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.
Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.
Stay ahead with daily AI briefings
Follow the feed, share the briefing, or jump back into the archive.