----------------------------------------------------------------------------------
@MSGID: 2:5053/51 749d0d30
@TID: FMail/2 1.48b
@PID: FTools/2 1.48b
Lenta.ru:
https://lenta.ru/news/2024/11/29/ucheny/
29.11.2024 14:38 Российские ученые создали открытую среду для
контекстного обучения с подкреплением
Российские ученые создали открытую среду для контекстного обучения с
подкреплением
Ученые из T-Bank AI Research представили среду для исследований
XLand-MiniGridКонстантин Паршин
Ученые из лаборатории исследований искусственного интеллекта T-Bank AI
Research и Института AIRI при участии студентов из МФТИ, Сколтеха и
Иннополиса создали первую открытую среду для исследований и разработки алгоритмов
в области контекстного обучения с подкреплением - XLand-MiniGrid.
В Т-Банке отметили, что XLand-MiniGrid -это опубликованная в открытом
доступе для исследователей по всему миру виртуальная среда, в которой
искусственный интеллект (ИИ) обучается принимать решения и выполнять новые действия.
Такая среда особенно полезна в таких областях, как персонализированные
рекомендации, управление роботами и автономными транспортными средствами, где
требуется мгновенная адаптация к новым условиям.
XLand-MiniGrid уже получила признание в международном исследовательском
сообществе.
Ранее исследователи сталкивались с ограничениями в существующих средах
для контекстного обучения с подкреплением. Корпоративные среды крупных
компаний, таких как Google DeepMind, закрыты для внешних пользователей и
используются только для внутренних нужд.
Также в отличие от более медленных аналогов, XLand-MiniGrid выполняет
миллиарды операций в секунду. В таких средах благодаря высокой вариативности и
количеству действий можно собирать огромные датасеты. Например, в XLand-MiniGrid
собрано 100 миллиардов примеров действий искусственного интеллекта в 30
тысячах задач.
`Мы пришли в область контекстного обучения с подкреплением, когда она
еще зарождалась, и поэтому не нашли ни одного подходящего инструмента для
оценки новых идей. Стало понятно, что это проблема для многих специалистов,
а значит, она должна быть решена одной из первых. Поэтому появился
XLand-MiniGrid`, - рассказал исследователь научной группы AI Alignment лаборатории
исследований искусственного интеллекта T-Bank AI Research Вячеслав Синий.
В свою очередь руководитель научной группы `Адаптивные агенты`
Института AIRI Владислав Куренков подчеркнул, что контекстное обучение с
подкреплением - одна из самых многообещающих областей науки в сфере ИИ.
`Оно позволяет получать агентов, адаптирующихся к новым сценариям на
лету на основе внешнего фидбэка. Среда, которую мы разработали, позволит
значительно ускорить сравнение и создание новых алгоритмов в этой области`, -
заключил он.
--- NewsRobot V0.14l/OS2 (C) W2M PROGRAMMING, 02.2014-02.2022
* Origin: CONCORD BBS (2:5053/51.0)
SEEN-BY: 50/109 221/6 301/1 341/66 452/28 463/68
467/888 4500/1 5000/111
SEEN-BY: 5001/100 5005/49 5010/352 5015/42 5019/40
5020/113 715 830 848 1042
SEEN-BY: 5020/4441 12000 5030/49 115 1081 5049/3
5053/51 57 5058/104 5061/133
SEEN-BY: 5083/1 444 6090/1
@PATH: 5053/51 5020/1042 4441