Специалисты MIT разработали подход, который позволяет системам искусственного интеллекта более успешно справляться со сложными задачами, имеющими неопределенные или изменяющиеся условия. Эта методика ускоряет процесс обучения и улучшает производительность ИИ в различных областях, таких как управление трафиком и медицинская аналитика.
Проблемы моделей обучения с подкреплением
Модели, работающие на основе обучения с подкреплением, часто испытывают трудности при взаимодействии с небольшими изменениями в задачах, к которым они были подготовлены. Например, в системе управления дорожным движением модели могут сталкиваться с проблемами при контроле разнообразных перекрестков, отличающихся ограничениями скорости, количеством полос и схемами движения.
Алгоритм MBTL
Исследователи создали алгоритм под названием MBTL (Model-Based Transfer Learning), который целенаправленно отбирает наилучшие задачи для процесса обучения. Это позволяет моделям ИИ эффективно выполнять всю гамму задач в заданном наборе. Например, в системе управления светофорами MBTL выбирает перекрестки, которые оказывают наибольшее влияние на общий трафик, снижая затраты времени и ресурсов на обучение.
Преимущества MBTL
- Эффективность в 5-50 раз по сравнению с традиционными методами
- Сопоставимые результаты при меньших объемах данных
- Снижение вычислительных затрат и ресурсов
Исследование подтвердило, что применение MBTL открывает новые возможности для реальных систем, требующих адаптационных решений.
Это интересно: Эйнштейн снова не прав и его главную теорию переписали: как это меняет мир