DexTer: Слабке напівконтрольоване виявлення об'єктів з експертами класу та екземплярів для медичної візуалізації
Виявлення анатомічних орієнтирів у медичній візуалізації має важливе значення для діагностики та керівництва втручанням. Однак моделі виявлення об'єктів покладаються на дорогі анотації обмежувальних коробок, що обмежує масштабованість. Слабке напівконтрольоване виявлення об'єктів (WSSOD) з точковими анотаціями пропонує анотувати кожен екземпляр однією точкою, мінімізуючи час анотації, зберігаючи сигнали локалізації. Модель вчителя «точка-коробка», навчена на невеликій підмножині з міткою коробки, перетворює ці анотації точок у мітки псевдо-коробки для навчання детектора учнів. Тим не менш, медичні зображення представляють унікальні проблеми, включаючи анатомію, що перекривається, змінні розміри об'єктів та невловимі структури, які перешкоджають точному висновку обмежувальної коробки. Щоб подолати ці проблеми, ми представляємо DexTer (DETR з експертами), регресор Point-to-Box на основі трансформаторів, розроблений для медичної візуалізації. Побудований на основі Point-DETR, DexTER кодує одноточкові анотації як об'єктні запити, вдосконалюючи вилучення функцій із запропонованою деформованою увагою, керованою класом, яка спрямовує вибірку уваги за допомогою точкових координат та міток класів для фіксації характеристик, специфічних для класу. Щоб покращити дискримінацію у складних структурах, він вводить Click-moe (клас, екземпляр та суміш експертів загального знання), роз'єднуючи представлення класів та екземплярів, щоб зменшити плутанину між сусідніми або перекриваються екземплярами. Нарешті, ми реалізуємо багатоточкову стратегію навчання, яка сприяє послідовності прогнозування в різних точкових місцях, покращуючи стійкість до мінливості анотацій. Dexter досягає найсучасніших характеристик у трьох наборах даних, що охоплюють різні медичні сфери (ендоскопія, рентген грудної клітки та ендоскопічне ультразвукове дослідження), підкреслюючи його потенціал зменшити витрати на анотації, зберігаючи високу точність виявлення.
At a glance
- Source
- arXiv
- Published
- Jan 20, 2026
- Read time
- 1 min read
- Primary lane
- Computer Vision
Quick read
1 bullets- Виявлення анатомічних орієнтирів у медичній візуалізації має важливе значення для діагностики та керівництва втручанням. Однак моделі виявлення об'єктів покладаються на дорогі анотації обмежувальних коробок, що обмежує масштабованість. Слабке напівконтрольоване виявлення об'єктів (WSSOD) з точковими анотаціями пропонує анотувати кожен екземпляр однією точкою, мінімізуючи час анотації, зберігаючи сигнали локалізації. Модель вчителя «точка-коробка», навчена на невеликій підмножині з міткою коробки, перетворює ці анотації точок у мітки псевдо-коробки для навчання детектора учнів. Тим не менш, медичні зображення представляють унікальні проблеми, включаючи анатомію, що перекривається, змінні розміри об'єктів та невловимі структури, які перешкоджають точному висновку обмежувальної коробки. Щоб подолати ці проблеми, ми представляємо DexTer (DETR з експертами), регресор Point-to-Box на основі трансформаторів, розроблений для медичної візуалізації. Побудований на основі Point-DETR, DexTER кодує одноточкові анотації як об'єктні запити, вдосконалюючи вилучення функцій із запропонованою деформованою увагою, керованою класом, яка спрямовує вибірку уваги за допомогою точкових координат та міток класів для фіксації характеристик, специфічних для класу. Щоб покращити дискримінацію у складних структурах, він вводить Click-moe (клас, екземпляр та суміш експертів загального знання), роз'єднуючи представлення класів та екземплярів, щоб зменшити плутанину між сусідніми або перекриваються екземплярами. Нарешті, ми реалізуємо багатоточкову стратегію навчання, яка сприяє послідовності прогнозування в різних точкових місцях, покращуючи стійкість до мінливості анотацій. Dexter досягає найсучасніших характеристик у трьох наборах даних, що охоплюють різні медичні сфери (ендоскопія, рентген грудної клітки та ендоскопічне ультразвукове дослідження), підкреслюючи його потенціал зменшити витрати на анотації, зберігаючи високу точність виявлення.
Чому це важливо
Виявлення анатомічних орієнтирів у медичній візуалізації має важливе значення для діагностики та керівництва втручанням. Однак моделі виявлення об'єктів покладаються на дорогі анотації обмежувальних коробок, що обмежує масштабованість. Слабке напівконтрольоване виявлення об'єктів (WSSOD) з точковими анотаціями пропонує анотувати кожен екземпляр однією точкою, мінімізуючи час анотації, зберігаючи сигнали локалізації. Модель вчителя «точка-коробка», навчена на невеликій підмножині з міткою коробки, перетворює ці анотації точок у мітки псевдо-коробки для навчання детектора учнів. Тим не менш, медичні зображення представляють унікальні проблеми, включаючи анатомію, що перекривається, змінні розміри об'єктів та невловимі структури, які перешкоджають точному висновку обмежувальної коробки. Щоб подолати ці проблеми, ми представляємо DexTer (DETR з експертами), регресор Point-to-Box на основі трансформаторів, розроблений для медичної візуалізації. Побудований на основі Point-DETR, DexTER кодує одноточкові анотації як об'єктні запити, вдосконалюючи вилучення функцій із запропонованою деформованою увагою, керованою класом, яка спрямовує вибірку уваги за допомогою точкових координат та міток класів для фіксації характеристик, специфічних для класу. Щоб покращити дискримінацію у складних структурах, він вводить Click-moe (клас, екземпляр та суміш експертів загального знання), роз'єднуючи представлення класів та екземплярів, щоб зменшити плутанину між сусідніми або перекриваються екземплярами. Нарешті, ми реалізуємо багатоточкову стратегію навчання, яка сприяє послідовності прогнозування в різних точкових місцях, покращуючи стійкість до мінливості анотацій. Dexter досягає найсучасніших характеристик у трьох наборах даних, що охоплюють різні медичні сфери (ендоскопія, рентген грудної клітки та ендоскопічне ультразвукове дослідження), підкреслюючи його потенціал зменшити витрати на анотації, зберігаючи високу точність виявлення.
Builder takeaway
arXiv published this update in the Computer Vision lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.
Виявлення анатомічних орієнтирів у медичній візуалізації має важливе значення для діагностики та керівництва втручанням. Однак моделі виявлення об'єктів покладаються на дорогі анотації обмежувальних коробок, що обмежує масштабованість. Слабке напівконтрольоване виявлення об'єктів (WSSOD) з точковими анотаціями пропонує анотувати кожен екземпляр однією точкою, мінімізуючи час анотації, зберігаючи сигнали локалізації. Модель вчителя «точка-коробка», навчена на невеликій підмножині з міткою коробки, перетворює ці анотації точок у мітки псевдо-коробки для навчання детектора учнів. Тим не менш, медичні зображення представляють унікальні проблеми, включаючи анатомію, що перекривається, змінні розміри об'єктів та невловимі структури, які перешкоджають точному висновку обмежувальної коробки. Щоб подолати ці проблеми, ми представляємо DexTer (DETR з експертами), регресор Point-to-Box на основі трансформаторів, розроблений для медичної візуалізації. Побудований на основі Point-DETR, DexTER кодує одноточкові анотації як об'єктні запити, вдосконалюючи вилучення функцій із запропонованою деформованою увагою, керованою класом, яка спрямовує вибірку уваги за допомогою точкових координат та міток класів для фіксації характеристик, специфічних для класу. Щоб покращити дискримінацію у складних структурах, він вводить Click-moe (клас, екземпляр та суміш експертів загального знання), роз'єднуючи представлення класів та екземплярів, щоб зменшити плутанину між сусідніми або перекриваються екземплярами. Нарешті, ми реалізуємо багатоточкову стратегію навчання, яка сприяє послідовності прогнозування в різних точкових місцях, покращуючи стійкість до мінливості анотацій. Dexter досягає найсучасніших характеристик у трьох наборах даних, що охоплюють різні медичні сфери (ендоскопія, рентген грудної клітки та ендоскопічне ультразвукове дослідження), підкреслюючи його потенціал зменшити витрати на анотації, зберігаючи високу точність виявлення.
Stay ahead with daily AI briefings
Follow the feed, share the briefing, or jump back into the archive.