arXiv

Автоматична класифікація арабської літератури на історичні епохи

З часом арабська мова зазнала значних змін, включаючи появу нової лексики, застаріння інших і зміни у словнику.Ця еволюція очевидна в розрізненні між класичною та сучасною арабською епохою.Хоча історики та лінгвісти розділили арабську літературу на кілька епох, відносно мало досліджень вивчало автоматичну класифікацію арабських текстів за періодами часу, особливо за межами поезії.Ця стаття усуває цю прогалину, використовуючи нейронні мережі та методи глибокого навчання для автоматичної класифікації арабських текстів на окремі епохи та періоди.Запропоновані моделі оцінюються за допомогою двох наборів даних, отриманих із двох загальнодоступних корпусів, що охоплюють тексти від доісламської до сучасної епохи.Дослідження вивчає налаштування класів, починаючи від двійкової до 15-класової класифікації, і розглядає як попередньо визначені історичні епохи, так і спеціальну періодизацію.Результати варіюються від балів F1 0,83 і 0,79 для завдання класифікації двійкової ери з використанням наборів даних OpenITI та APCD відповідно до 0,20 для завдання класифікації 15 ер з використанням OpenITI та 0,18 для завдання класифікації 12 ер з використанням APCD.

arXiv||1 min read
Open original

At a glance

Source
arXiv
Published
Jan 22, 2026
Read time
1 min read
Primary lane
Cs.cl

Quick read

1 bullets
  • З часом арабська мова зазнала значних змін, включаючи появу нової лексики, застаріння інших і зміни у словнику.Ця еволюція очевидна в розрізненні між класичною та сучасною арабською епохою.Хоча історики та лінгвісти розділили арабську літературу на кілька епох, відносно мало досліджень вивчало автоматичну класифікацію арабських текстів за періодами часу, особливо за межами поезії.Ця стаття усуває цю прогалину, використовуючи нейронні мережі та методи глибокого навчання для автоматичної класифікації арабських текстів на окремі епохи та періоди.Запропоновані моделі оцінюються за допомогою двох наборів даних, отриманих із двох загальнодоступних корпусів, що охоплюють тексти від доісламської до сучасної епохи.Дослідження вивчає налаштування класів, починаючи від двійкової до 15-класової класифікації, і розглядає як попередньо визначені історичні епохи, так і спеціальну періодизацію.Результати варіюються від балів F1 0,83 і 0,79 для завдання класифікації двійкової ери з використанням наборів даних OpenITI та APCD відповідно до 0,20 для завдання класифікації 15 ер з використанням OpenITI та 0,18 для завдання класифікації 12 ер з використанням APCD.

Чому це важливо

З часом арабська мова зазнала значних змін, включаючи появу нової лексики, застаріння інших і зміни у словнику.Ця еволюція очевидна в розрізненні між класичною та сучасною арабською епохою.Хоча історики та лінгвісти розділили арабську літературу на кілька епох, відносно мало досліджень вивчало автоматичну класифікацію арабських текстів за періодами часу, особливо за межами поезії.Ця стаття усуває цю прогалину, використовуючи нейронні мережі та методи глибокого навчання для автоматичної класифікації арабських текстів на окремі епохи та періоди.Запропоновані моделі оцінюються за допомогою двох наборів даних, отриманих із двох загальнодоступних корпусів, що охоплюють тексти від доісламської до сучасної епохи.Дослідження вивчає налаштування класів, починаючи від двійкової до 15-класової класифікації, і розглядає як попередньо визначені історичні епохи, так і спеціальну періодизацію.Результати варіюються від балів F1 0,83 і 0,79 для завдання класифікації двійкової ери з використанням наборів даних OpenITI та APCD відповідно до 0,20 для завдання класифікації 15 ер з використанням OpenITI та 0,18 для завдання класифікації 12 ер з використанням APCD.

Builder takeaway

arXiv published this update in the Cs.cl lane. Use the original source for details, then compare it with related briefings before changing a roadmap, workflow, or production system.

З часом арабська мова зазнала значних змін, включаючи появу нової лексики, застаріння інших і зміни у словнику.Ця еволюція очевидна в розрізненні між класичною та сучасною арабською епохою.Хоча історики та лінгвісти розділили арабську літературу на кілька епох, відносно мало досліджень вивчало автоматичну класифікацію арабських текстів за періодами часу, особливо за межами поезії.Ця стаття усуває цю прогалину, використовуючи нейронні мережі та методи глибокого навчання для автоматичної класифікації арабських текстів на окремі епохи та періоди.Запропоновані моделі оцінюються за допомогою двох наборів даних, отриманих із двох загальнодоступних корпусів, що охоплюють тексти від доісламської до сучасної епохи.Дослідження вивчає налаштування класів, починаючи від двійкової до 15-класової класифікації, і розглядає як попередньо визначені історичні епохи, так і спеціальну періодизацію.Результати варіюються від балів F1 0,83 і 0,79 для завдання класифікації двійкової ери з використанням наборів даних OpenITI та APCD відповідно до 0,20 для завдання класифікації 15 ер з використанням OpenITI та 0,18 для завдання класифікації 12 ер з використанням APCD.

Stay ahead with daily AI briefings

Follow the feed, share the briefing, or jump back into the archive.