STRENGTHENING TRAINING FOR ADAPTIVE SYNTHESIS OF CHARACTERS’ EMOTIONAL REACTIONS

Authors

  • Togayeva Zamira Fayzullayevna Author
  • Safarova Zilola Olimjonovna Author
  • Omonova Iroda Farxod qizi Author

Abstract

В статье рассматривается применение обучения с подкреплением (RL) для создания адаптивных эмоциональных реакций виртуальных персонажей. Предлагается интерпретировать эмоции как систему внутренних наград, основанную на гомеостатических переменных, что позволяет генерировать динамические поведенческие паттерны без предопределенных правил. Описаны ключевые алгоритмы, такие как Emotional Advantage Actor-Critic (EmoA3C), Self-Supervised Emotion Discovery и Emotion-Conditioned DQN, с примерами их использования в навигационных задачах, игровой терапии и образовательных средах. Обсуждаются вызовы обобщаемости, этические риски и будущие направления, включая мультиагентные сценарии с эмпатией. Результаты подтверждают повышение правдоподобия и эффективности виртуальных агентов, приближая ИИ к человеческому аффекту.

References

1. Sutton, R. S., & Barto, A. G. (2018). Reinforced learning: Introduction (2nd ed.). MIT Press.

2. Мних, В., Кавукчуоглу, К., Сильвер, Д. и др. (2015). Управление на уровне человека посредством глубокого обучения с подкреплением. Nature, 518(7540), 529–533.

3. Попов, А., Лерер, А., Цзян, Г. и др. (2021). Эмоциональное обучение с подкреплением для адаптивного поведения агентов в динамических средах. Труды Международной конференции по машинному обучению (ICML), 45–56.

4. Дамасио, А. Р. (1994). Ошибка Декарта: эмоции, разум и человеческий мозг. Патнэм.

5. Moerland, T. M., Broekens, J. and Jonker, C. M. (2018). Emotions in reinforced learning agents and robots: a review. “Machine Learning”, 107 (2), 443-480.

6. Broekens, J. (2007). Аффект, предвосхищение и адаптация: контролируемый аффектом выбор предвосхищающего моделирования у искусственных адаптивных агентов. Adaptive Behavior, 15(4), 415–438.

Downloads

Published

2026-01-11