Группа исследователей из Google DeepMind разработала систему обучения с подкреплением, которая может создавать оптимизированные алгоритмы без предварительного обучения на примерах человеческого кода. Система называется AlphaDev и использует тот же подход, что и знаменитая AlphaGo, которая учится играть в игры, такие как Го, покер и StarCraft. Она рассматривает программирование как игру, в которой нужно минимизировать задержку кода при сохранении его корректности.
AlphaDev смогла сгенерировать новые алгоритмы для таких фундаментальных задач компьютерной науки, как сортировка и
Источник: SecurityLab