Учёные из лаборатории исследований искусственного интеллекта T‑Bank AI Research и Института AIRI при участии студентов из МФТИ, Сколтеха и Университета Иннополис создали первую открытую среду для исследований и разработки алгоритмов в области контекстного обучения с подкреплением — XLand‑MiniGrid.Это опубликованная в открытом доступе для исследователей по всему миру виртуальная среда, в которой искусственный интеллект (ИИ) обучается принимать решения и выполнять новые действия.Контекстное обучение с подкреплением (In‑Context RL) — это новое направление в ИИ, где модели быстро адаптируются к новым задачам, используя подсказки и контекст, а не требуют длительного обучения с нуля.
Это позволяет ИИ эффективно взаимодействовать с окружающей средой и дообучаться на лету. In‑Context RL особенно полезно в таких областях, как персонализированные рекомендации, управление роботами и автономными транспортными средствами, где требуется мгновенная адаптация к новым условиям.Ранее исследователи сталкивались с ограничениями в существующих средах для контекстного обучения с подкреплением.
Корпоративные среды крупных компаний, таких как Google DeepMind, закрыты для внешних пользователей и используются только для внутренних нужд.
Читать на habr.com