Зверніть (перехресну) увагу на мелодію: Маскування навчальної програми для мелодичної гармонізації з одним кодувальником

Quick read

1 bullets

Мелодична гармонізація, завдання генерації гармонічного супроводу для даної мелодії, залишається центральною проблемою в обчислювальній генерації музики.Останні підходи трансформатора з одним кодером розглядають гармонізацію як проблему моделювання замаскованої послідовності, але існуючі навчальні програми, натхненні дискретною дифузією, часто призводять до слабкої (перехресної) уваги між мелодією та гармонією.Це призводить до обмеженого використання мелодичних сигналів, особливо в контекстах поза доменом.У цій роботі ми представляємо навчальну програму FF (full-to-full), яка зберігає всі маркери гармонії замаскованими протягом кількох кроків навчання перед поступовим розкриттям цілої послідовності під час навчання для посилення взаємодії мелодії та гармонії.Ми систематично оцінюємо цей підхід у порівнянні з попередніми навчальними програмами за кількома експериментальними осями, включно з квантуванням у часі (четверть проти шістнадцятої ноти), кондиціонування рівня такту проти тактового розміру, представлення мелодії (повний діапазон проти класу висоти) та стратегії демаскування часу висновку.Моделі навчаються на наборі даних HookTheory і оцінюються як у домені, так і на кураторській колекції джазових стандартів, використовуючи повний набір показників, які оцінюють структуру прогресії акордів, гармонійно-мелодійне вирівнювання та ритмічну когерентність.Результати демонструють, що запропонована навчальна програма FF стабільно перевершує базові показники майже за всіма показниками, з особливо сильними перевагами в оцінках поза областями, де гармонічна адаптація до нових мелодичних черг є вирішальною.Крім того, ми виявили, що квантування чвертей ноти, переплетення маркерів штрихів і репрезентації мелодії з висотою звуку є перевагами в налаштуваннях FF.Наші висновки підкреслюють важливість навчальних програм для забезпечення ефективного кондиціонування мелодії та свідчать про те, що повне демаскування пропонує надійну стратегію для гармонізації одного кодера.

Чому це важливо

✦

Мелодична гармонізація, завдання генерації гармонічного супроводу для даної мелодії, залишається центральною проблемою в обчислювальній генерації музики.Останні підходи трансформатора з одним кодером розглядають гармонізацію як проблему моделювання замаскованої послідовності, але існуючі навчальні програми, натхненні дискретною дифузією, часто призводять до слабкої (перехресної) уваги між мелодією та гармонією.Це призводить до обмеженого використання мелодичних сигналів, особливо в контекстах поза доменом.У цій роботі ми представляємо навчальну програму FF (full-to-full), яка зберігає всі маркери гармонії замаскованими протягом кількох кроків навчання перед поступовим розкриттям цілої послідовності під час навчання для посилення взаємодії мелодії та гармонії.Ми систематично оцінюємо цей підхід у порівнянні з попередніми навчальними програмами за кількома експериментальними осями, включно з квантуванням у часі (четверть проти шістнадцятої ноти), кондиціонування рівня такту проти тактового розміру, представлення мелодії (повний діапазон проти класу висоти) та стратегії демаскування часу висновку.Моделі навчаються на наборі даних HookTheory і оцінюються як у домені, так і на кураторській колекції джазових стандартів, використовуючи повний набір показників, які оцінюють структуру прогресії акордів, гармонійно-мелодійне вирівнювання та ритмічну когерентність.Результати демонструють, що запропонована навчальна програма FF стабільно перевершує базові показники майже за всіма показниками, з особливо сильними перевагами в оцінках поза областями, де гармонічна адаптація до нових мелодичних черг є вирішальною.Крім того, ми виявили, що квантування чвертей ноти, переплетення маркерів штрихів і репрезентації мелодії з висотою звуку є перевагами в налаштуваннях FF.Наші висновки підкреслюють важливість навчальних програм для забезпечення ефективного кондиціонування мелодії та свідчать про те, що повне демаскування пропонує надійну стратегію для гармонізації одного кодера.

Builder takeaway

arXiv published this update in the Cs.sd lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

Мелодична гармонізація, завдання генерації гармонічного супроводу для даної мелодії, залишається центральною проблемою в обчислювальній генерації музики.Останні підходи трансформатора з одним кодером розглядають гармонізацію як проблему моделювання замаскованої послідовності, але існуючі навчальні програми, натхненні дискретною дифузією, часто призводять до слабкої (перехресної) уваги між мелодією та гармонією.Це призводить до обмеженого використання мелодичних сигналів, особливо в контекстах поза доменом.У цій роботі ми представляємо навчальну програму FF (full-to-full), яка зберігає всі маркери гармонії замаскованими протягом кількох кроків навчання перед поступовим розкриттям цілої послідовності під час навчання для посилення взаємодії мелодії та гармонії.Ми систематично оцінюємо цей підхід у порівнянні з попередніми навчальними програмами за кількома експериментальними осями, включно з квантуванням у часі (четверть проти шістнадцятої ноти), кондиціонування рівня такту проти тактового розміру, представлення мелодії (повний діапазон проти класу висоти) та стратегії демаскування часу висновку.Моделі навчаються на наборі даних HookTheory і оцінюються як у домені, так і на кураторській колекції джазових стандартів, використовуючи повний набір показників, які оцінюють структуру прогресії акордів, гармонійно-мелодійне вирівнювання та ритмічну когерентність.Результати демонструють, що запропонована навчальна програма FF стабільно перевершує базові показники майже за всіма показниками, з особливо сильними перевагами в оцінках поза областями, де гармонічна адаптація до нових мелодичних черг є вирішальною.Крім того, ми виявили, що квантування чвертей ноти, переплетення маркерів штрихів і репрезентації мелодії з висотою звуку є перевагами в налаштуваннях FF.Наші висновки підкреслюють важливість навчальних програм для забезпечення ефективного кондиціонування мелодії та свідчать про те, що повне демаскування пропонує надійну стратегію для гармонізації одного кодера.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.

Subscribe via RSS Browse archive