ViaFormer: трансформатор вирівнювання воксельних зображень для вдосконалення вокселів високої точності

Quick read

1 bullets

Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.

Чому це важливо

✦

Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.

Builder takeaway

arXiv published this update in the Computer Vision lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

Ми пропонуємо ViaFormer, модель трансформатора вирівнювання Voxel-Image, розроблену для вдосконалення умовного вокселя з кількома переглядами - завдання відновлення неповних шумних вокселів за допомогою каліброваних зображень із кількома переглядами як керівництва. Його ефективність випливає з синергетичного дизайну: індексу зображення, який забезпечує чітке 3D-просторове обґрунтування для токенів 2D-зображень, об'єкта виправного потоку, яка вивчає пряму траєкторію вдосконалення вокселів, та гібридний трансформатор потоку, який забезпечує надійне крос-модальне злиття. Експерименти показують, що ViaFormer встановлює новий стан техніки у виправленні як серйозних синтетичних пошкоджень, так і реалістичних артефактів на формі вокселя, отриманої з потужних моделей Vision Foundation. Окрім бенчмаркінгу, ми демонструємо ViaFormer як практичний та надійний міст у реальних конвеєрах створення 3D, відкриваючи шлях для методів на основі вокселів для процвітання у великій моделі хвилі великих даних.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.

Subscribe via RSS Browse archive