Учёные из лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI разработали датасет для контекстного обучения с подкреплением XLand-100B.
Создатели обещают, что он поможет быстрее и дешевле проводить исследования без привлечения узкопрофильных специалистов и ставить эксперименты на синтетических данных для анализа новых подходов в обучении ИИ.Массив данных включает 100 млрд примеров действий ИИ-агента на 30 тыс.
задач. Для создания такого датасета потребовалось суммарно около 50 тыс. GPU-часов, сообщают в T-Bank AI Research. В рамках контекстного обучения с подкреплением (In-Сontext RL) модели ИИ обучаются на массивах данных с демонстрацией правильного решения конкретных задач.
Читать на habr.com