Людські цінності в одному реченні: моральна присутність, ієрархії та ансамблі трансформерів на шварцовому континуумі

Quick read

1 bullets

Ми вивчаємо ідентифікацію 19 значень на рівні речення в мотиваційному континуумі Шварца як конкретне формулювання виявлення людської цінності в тексті. Обстановка - поза контекстом речення з новин та політичних маніфестів - має рідкісні моральні сигнали та серйозний класовий дисбаланс. Ця комбінація суттєво ускладнює визначення значень на рівні речення навіть для сильних сучасних нейронних моделей. Спочатку ми операціонізуємо завдання бінарної моральної присутності («чи з'являється якась цінність?») і покажіть, що його можна вивчити з окремих речень (позитивний клас F1 $\ approx$ 0,74 з каліброваними порогами). Потім ми порівнюємо ієрархію, керовану присутністю, з прямим класифікатором з кількома мітками за відповідними обчисленнями, як на основі Deberta-base, так і доповненим легкими сигналами (контекст попереднього речення, лексика LiWC-22/EMFD/MJD та особливості теми). Ієрархія не перевершує пряме прогнозування, що вказує на те, що відкликання воріт обмежує прибутки за течією. Ми також тестуємо LLM, налаштовані на інструкції - Gemma 2 9B, Llama 3.1 8B, Mistral 8B та Qwen 2.5 7B - у налаштуваннях нульова/кількох знімків та QLoRa та будуємо прості ансамблі; ансамбль під контролем із м'яким голосом досягає Macro-F1 0.332, значно перевершуючи найкращу одиночну контрольовану модель та перевищуючи попередні базові лінії лише англійською мовою. Загалом, у цьому сценарії легкі сигнали та невеликі ансамблі дають найнадійніші вдосконалення, тоді як ієрархічний ворот пропонує обмежену користь. Ми стверджуємо, що при обмеженні 8 ГБ одного графічного процесора та в масштабі 7-9B ретельно налаштовані контрольовані кодери залишаються сильною та ефективною для обчислень базовою лінією для структурованого виявлення людської цінності, і ми окреслюємо, наскільки багатша структура цінностей та контекст речення в документі можуть ще більше покращити продуктивність.

Чому це важливо

✦

Ми вивчаємо ідентифікацію 19 значень на рівні речення в мотиваційному континуумі Шварца як конкретне формулювання виявлення людської цінності в тексті. Обстановка - поза контекстом речення з новин та політичних маніфестів - має рідкісні моральні сигнали та серйозний класовий дисбаланс. Ця комбінація суттєво ускладнює визначення значень на рівні речення навіть для сильних сучасних нейронних моделей. Спочатку ми операціонізуємо завдання бінарної моральної присутності («чи з'являється якась цінність?») і покажіть, що його можна вивчити з окремих речень (позитивний клас F1 $\ approx$ 0,74 з каліброваними порогами). Потім ми порівнюємо ієрархію, керовану присутністю, з прямим класифікатором з кількома мітками за відповідними обчисленнями, як на основі Deberta-base, так і доповненим легкими сигналами (контекст попереднього речення, лексика LiWC-22/EMFD/MJD та особливості теми). Ієрархія не перевершує пряме прогнозування, що вказує на те, що відкликання воріт обмежує прибутки за течією. Ми також тестуємо LLM, налаштовані на інструкції - Gemma 2 9B, Llama 3.1 8B, Mistral 8B та Qwen 2.5 7B - у налаштуваннях нульова/кількох знімків та QLoRa та будуємо прості ансамблі; ансамбль під контролем із м'яким голосом досягає Macro-F1 0.332, значно перевершуючи найкращу одиночну контрольовану модель та перевищуючи попередні базові лінії лише англійською мовою. Загалом, у цьому сценарії легкі сигнали та невеликі ансамблі дають найнадійніші вдосконалення, тоді як ієрархічний ворот пропонує обмежену користь. Ми стверджуємо, що при обмеженні 8 ГБ одного графічного процесора та в масштабі 7-9B ретельно налаштовані контрольовані кодери залишаються сильною та ефективною для обчислень базовою лінією для структурованого виявлення людської цінності, і ми окреслюємо, наскільки багатша структура цінностей та контекст речення в документі можуть ще більше покращити продуктивність.

Builder takeaway

arXiv published this update in the NLP lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

Ми вивчаємо ідентифікацію 19 значень на рівні речення в мотиваційному континуумі Шварца як конкретне формулювання виявлення людської цінності в тексті. Обстановка - поза контекстом речення з новин та політичних маніфестів - має рідкісні моральні сигнали та серйозний класовий дисбаланс. Ця комбінація суттєво ускладнює визначення значень на рівні речення навіть для сильних сучасних нейронних моделей. Спочатку ми операціонізуємо завдання бінарної моральної присутності («чи з'являється якась цінність?») і покажіть, що його можна вивчити з окремих речень (позитивний клас F1 $\ approx$ 0,74 з каліброваними порогами). Потім ми порівнюємо ієрархію, керовану присутністю, з прямим класифікатором з кількома мітками за відповідними обчисленнями, як на основі Deberta-base, так і доповненим легкими сигналами (контекст попереднього речення, лексика LiWC-22/EMFD/MJD та особливості теми). Ієрархія не перевершує пряме прогнозування, що вказує на те, що відкликання воріт обмежує прибутки за течією. Ми також тестуємо LLM, налаштовані на інструкції - Gemma 2 9B, Llama 3.1 8B, Mistral 8B та Qwen 2.5 7B - у налаштуваннях нульова/кількох знімків та QLoRa та будуємо прості ансамблі; ансамбль під контролем із м'яким голосом досягає Macro-F1 0.332, значно перевершуючи найкращу одиночну контрольовану модель та перевищуючи попередні базові лінії лише англійською мовою. Загалом, у цьому сценарії легкі сигнали та невеликі ансамблі дають найнадійніші вдосконалення, тоді як ієрархічний ворот пропонує обмежену користь. Ми стверджуємо, що при обмеженні 8 ГБ одного графічного процесора та в масштабі 7-9B ретельно налаштовані контрольовані кодери залишаються сильною та ефективною для обчислень базовою лінією для структурованого виявлення людської цінності, і ми окреслюємо, наскільки багатша структура цінностей та контекст речення в документі можуть ще більше покращити продуктивність.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.

Subscribe via RSS Browse archive