LizzieSimpson технологии экономика конференция интересное google LizzieSimpson
/ habr.com

Учёные из T-Bank AI Research и AIRI создали первую открытую среду для контекстного обучения с подкреплением

Учёные из лаборатории исследований искусственного интеллекта T‑Bank AI Research и Института AIRI при участии студентов из МФТИ, Сколтеха и Университета Иннополис создали первую открытую среду для исследований и разработки алгоритмов в области контекстного обучения с подкреплением — XLand‑MiniGrid.Это опубликованная в открытом доступе для исследователей по всему миру виртуальная среда, в которой искусственный интеллект (ИИ) обучается принимать решения и выполнять новые действия.Контекстное обучение с подкреплением (In‑Context RL) — это новое направление в ИИ, где модели быстро адаптируются к новым задачам, используя подсказки и контекст, а не требуют длительного обучения с нуля.

Это позволяет ИИ эффективно взаимодействовать с окружающей средой и дообучаться на лету. In‑Context RL особенно полезно в таких областях, как персонализированные рекомендации, управление роботами и автономными транспортными средствами, где требуется мгновенная адаптация к новым условиям.Ранее исследователи сталкивались с ограничениями в существующих средах для контекстного обучения с подкреплением.

Корпоративные среды крупных компаний, таких как Google DeepMind, закрыты для внешних пользователей и используются только для внутренних нужд.

Читать на habr.com
Сайт imag.one - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Сейчас читают

DMCA