arXiv

Генерація контенту від руху до відповіді за допомогою багатоагентної системи штучного інтелекту з перевіркою безпеки в режимі реального часу

У цій статті пропонується багатоагентна система штучного інтелекту, яка генерує медіаконтент, орієнтований на реакцію, в режимі реального часу на основі емоційних сигналів, отриманих від аудіо. На відміну від звичайних досліджень розпізнавання мовних емоцій, які зосереджуються насамперед на точності класифікації, наш підхід підкреслює перетворення виведених емоційних станів у безпечний, відповідний віку та контрольований вміст реакції за допомогою структурованого конвеєра спеціалізованих агентів штучного інтелекту. Запропонована система складається з чотирьох кооперативних агентів: (1) агент розпізнавання емоцій з вилученням акустичних ознак на основі CNN, (2) агент прийняття рішень щодо політики реагування для відображення емоцій у режими реакції, (3) агент генерування параметрів вмісту для створення параметрів управління носіями, і (4) агент перевірки безпеки, що забезпечує відповідність віку та обмеження стимуляції. Ми впроваджуємо чіткий цикл перевірки безпеки, який фільтрує згенерований вміст перед виведенням, забезпечуючи відповідність заздалегідь визначеним правилам. Експериментальні результати щодо загальнодоступних наборів даних демонструють, що система досягає 73,2% точності розпізнавання емоцій, 89,4% узгодженості режиму відповіді та 100% відповідності безпеці, зберігаючи затримку висновку менше 100 мс, придатну для розгортання на пристрої. Модульна архітектура забезпечує інтерпретацію та розширюваність, що робить її застосовною до медіа, сусідніх з дітьми, терапевтичних додатків та емоційно чутливих смарт-пристроїв.

arXiv||1 min read
Open original

At a glance

Source
arXiv
Published
Jan 19, 2026
Read time
1 min read
Primary lane
AI

Quick read

1 bullets
  • У цій статті пропонується багатоагентна система штучного інтелекту, яка генерує медіаконтент, орієнтований на реакцію, в режимі реального часу на основі емоційних сигналів, отриманих від аудіо. На відміну від звичайних досліджень розпізнавання мовних емоцій, які зосереджуються насамперед на точності класифікації, наш підхід підкреслює перетворення виведених емоційних станів у безпечний, відповідний віку та контрольований вміст реакції за допомогою структурованого конвеєра спеціалізованих агентів штучного інтелекту. Запропонована система складається з чотирьох кооперативних агентів: (1) агент розпізнавання емоцій з вилученням акустичних ознак на основі CNN, (2) агент прийняття рішень щодо політики реагування для відображення емоцій у режими реакції, (3) агент генерування параметрів вмісту для створення параметрів управління носіями, і (4) агент перевірки безпеки, що забезпечує відповідність віку та обмеження стимуляції. Ми впроваджуємо чіткий цикл перевірки безпеки, який фільтрує згенерований вміст перед виведенням, забезпечуючи відповідність заздалегідь визначеним правилам. Експериментальні результати щодо загальнодоступних наборів даних демонструють, що система досягає 73,2% точності розпізнавання емоцій, 89,4% узгодженості режиму відповіді та 100% відповідності безпеці, зберігаючи затримку висновку менше 100 мс, придатну для розгортання на пристрої. Модульна архітектура забезпечує інтерпретацію та розширюваність, що робить її застосовною до медіа, сусідніх з дітьми, терапевтичних додатків та емоційно чутливих смарт-пристроїв.

Чому це важливо

У цій статті пропонується багатоагентна система штучного інтелекту, яка генерує медіаконтент, орієнтований на реакцію, в режимі реального часу на основі емоційних сигналів, отриманих від аудіо. На відміну від звичайних досліджень розпізнавання мовних емоцій, які зосереджуються насамперед на точності класифікації, наш підхід підкреслює перетворення виведених емоційних станів у безпечний, відповідний віку та контрольований вміст реакції за допомогою структурованого конвеєра спеціалізованих агентів штучного інтелекту. Запропонована система складається з чотирьох кооперативних агентів: (1) агент розпізнавання емоцій з вилученням акустичних ознак на основі CNN, (2) агент прийняття рішень щодо політики реагування для відображення емоцій у режими реакції, (3) агент генерування параметрів вмісту для створення параметрів управління носіями, і (4) агент перевірки безпеки, що забезпечує відповідність віку та обмеження стимуляції. Ми впроваджуємо чіткий цикл перевірки безпеки, який фільтрує згенерований вміст перед виведенням, забезпечуючи відповідність заздалегідь визначеним правилам. Експериментальні результати щодо загальнодоступних наборів даних демонструють, що система досягає 73,2% точності розпізнавання емоцій, 89,4% узгодженості режиму відповіді та 100% відповідності безпеці, зберігаючи затримку висновку менше 100 мс, придатну для розгортання на пристрої. Модульна архітектура забезпечує інтерпретацію та розширюваність, що робить її застосовною до медіа, сусідніх з дітьми, терапевтичних додатків та емоційно чутливих смарт-пристроїв.

Builder takeaway

arXiv published this update in the AI lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

У цій статті пропонується багатоагентна система штучного інтелекту, яка генерує медіаконтент, орієнтований на реакцію, в режимі реального часу на основі емоційних сигналів, отриманих від аудіо. На відміну від звичайних досліджень розпізнавання мовних емоцій, які зосереджуються насамперед на точності класифікації, наш підхід підкреслює перетворення виведених емоційних станів у безпечний, відповідний віку та контрольований вміст реакції за допомогою структурованого конвеєра спеціалізованих агентів штучного інтелекту. Запропонована система складається з чотирьох кооперативних агентів: (1) агент розпізнавання емоцій з вилученням акустичних ознак на основі CNN, (2) агент прийняття рішень щодо політики реагування для відображення емоцій у режими реакції, (3) агент генерування параметрів вмісту для створення параметрів управління носіями, і (4) агент перевірки безпеки, що забезпечує відповідність віку та обмеження стимуляції. Ми впроваджуємо чіткий цикл перевірки безпеки, який фільтрує згенерований вміст перед виведенням, забезпечуючи відповідність заздалегідь визначеним правилам. Експериментальні результати щодо загальнодоступних наборів даних демонструють, що система досягає 73,2% точності розпізнавання емоцій, 89,4% узгодженості режиму відповіді та 100% відповідності безпеці, зберігаючи затримку висновку менше 100 мс, придатну для розгортання на пристрої. Модульна архітектура забезпечує інтерпретацію та розширюваність, що робить її застосовною до медіа, сусідніх з дітьми, терапевтичних додатків та емоційно чутливих смарт-пристроїв.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.