arXiv

HexFormer: гіперболічний візійний трансформер з агрегацією через експоненційне відображення

Представляє HexFormer — гіперболічний vision transformer для даних із ієрархічною/реляційною структурою.

arXiv||1 min read
Open original

At a glance

Source
arXiv
Published
Jan 27, 2026
Read time
1 min read
Primary lane
Cs.cv

Quick read

4 bullets
  • Представляє HexFormer — гіперболічний vision transformer для даних із ієрархічною/реляційною структурою.
  • Використовує агрегацію уваги на основі експоненційних мап і порівнює повністю гіперболічну модель із гібридом з евклідовою класифікаційною головою.
  • Показує стабільні покращення над евклідовими базовими моделями та попередніми гіперболічними ViT; найкраща — гібридна версія.
  • Аналізує навчання: градієнти стабільніші і менша чутливість до warmup порівняно з евклідовими аналогами.

Чому це важливо

Гіперболічні простори часто краще відображають ієрархії. HexFormer дає практичний дизайн уваги/агрегації та показує, що він може підвищувати точність і стабільність навчання, коли ієрархічна структура справді важлива.

Builder takeaway

arXiv published this update in the Cs.cv lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

Швидке читання

- Представляє HexFormer — гіперболічний vision transformer для даних із ієрархічною/реляційною структурою.

- Використовує агрегацію уваги на основі експоненційних мап і порівнює повністю гіперболічну модель із гібридом з евклідовою класифікаційною головою.

- Показує стабільні покращення над евклідовими базовими моделями та попередніми гіперболічними ViT; найкраща — гібридна версія.

- Аналізує навчання: градієнти стабільніші і менша чутливість до warmup порівняно з евклідовими аналогами.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.