arXiv

Симуляція з урахуванням мовця покращує розпізнавання розмовної мови

Використовує змодельовані розмови з урахуванням мовця (SASC), щоб перетворити аудіо з одним динаміком у реалістичний діалог з кількома мовцями для посилення ASR.

arXiv|Feb 4, 2026|1 min read

Open original

At a glance

Source: arXiv
Published: Feb 4, 2026
Read time: 1 min read
Primary lane: Speech

Speech ASR Data Augmentation

Quick read

4 bullets

Використовує змодельовані розмови з урахуванням мовця (SASC), щоб перетворити аудіо з одним динаміком у реалістичний діалог з кількома мовцями для посилення ASR.
Адаптує SASC до угорської розмовної ASR і пропонує C-SASC, додаючи моделювання пауз, обумовлених тривалістю, щоб краще відповідати людському часу.
Покращує розпізнавання порівняно з простою конкатенацією в багатьох налаштуваннях; виграш залежить від того, наскільки добре статистика моделювання відповідає цільовій області.
Чому це важливо: синтетичний діалог є важливим шляхом до кращого ASR для кількох мовців мовами з низьким ресурсом без збору масивних анотованих наборів даних розмов.

Чому це важливо

✦

Чому це важливо: синтетичний діалог є важливим шляхом до кращого ASR для кількох мовців мовами з низьким ресурсом без збору масивних анотованих наборів даних розмов.

Builder takeaway

arXiv published this update in the Speech lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

Швидке читання

- Використовує змодельовані розмови з урахуванням мовця (SASC), щоб перетворити аудіо з одним динаміком у реалістичний діалог з кількома мовцями для посилення ASR.

- Адаптує SASC до угорської розмовної ASR і пропонує C-SASC, додаючи моделювання пауз, обумовлених тривалістю, щоб краще відповідати людському часу.

- Покращує розпізнавання порівняно з простою конкатенацією в багатьох налаштуваннях; виграш залежить від того, наскільки добре статистика моделювання відповідає цільовій області.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.

Subscribe via RSS Browse archive