arXiv

ViaFormer: трансформатор вирівнювання воксельних зображень для вдосконалення вокселів високої точності

Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.

arXiv||1 min read
Open original

At a glance

Source
arXiv
Published
Jan 20, 2026
Read time
1 min read
Primary lane
Computer Vision

Quick read

1 bullets
  • Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.

Чому це важливо

Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.

Builder takeaway

arXiv published this update in the Computer Vision lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.