Alpha Zero. Без людей только лучше

Alpha Zero. Без людей только лучше

Не очень понимаю, откуда пошла мода в игровом комьюнити и не только предрекать деградацию и крах всего нейросетевого движа. Часто говорят о деградации из-за конца человеческий знаний, все уже в топку ушло, мол, дальше только пойдет сгенерированный шлак. Но есть один пример, который как бы намекает, что оно все наоборот.

AlphaGo была разработана Google DeepMind в 2015 году, обучалась она на играх людей. Потом пришла Alpha Zero, которая обучалась вообще без человеческих данных — ни одной партии, сыгранной людьми. Она училась с нуля, играя сама с собой. В итоге превзошла все версии AlphaGo и достигла сверхчеловеческого уровня.

И тут возникает вопрос. Игры играми, окей, но ведь в науке можно тоже провернуть подобное. Насколько я знаю, еще никто не кормил нейронку базовой физикой с целью получить какую-нибудь теорию струн. Научный мир периодически отказывается от теорий и парадигм, когда предлагают что-то новое, и это дело не давних дней, а постоянный процесс. И чертовски интересно, к чему придут выводы условной AlphaScience.

Человеческие данные — не предел

Когда предрекают деградацию ИИшек, обычно подразумевают ChatGPT и его подобные LLM. И вот тут история с Alpha Zero повторяется.

Человеческие данные заканчиваются — начинают обучать на синтетике. Получение синтетики постоянно апдейтят, каждый подход называют очередной непонятной аббревиатурой, в которой нужно разбираться отдельно. Но смысл именно в self-play подходе, как и с Alpha Zero. Зависимость от человеческих текстов постепенно уменьшается, а качество растет с каждым новым методом.

Эго начинают ущемлять, и никому это не нравится

Вам же ведь не нравится, что при достижении сверхчеловеческого уровня в любой сфере, человек концептуально бессилен, все, это потолок. Все равно что на вашей работе коллега делает то, что вам никогда не сделать, хоть как пытайся. Ну и становится как-то не по себе. Начали с того, что человек это венец творения Господа. Потом пришла наука, дала воодушевление, что вот щас мы все поймем, а вышло, что непонятно стало еще больше, чем понятно, а понятно нам часто неправильно, а потом и вовсе в потолок уперлись. Ну а сейчас сами видите что.

И когда критикуют авторов за ИИ контент, у меня появляется вопрос. Всех тех, кто занимается любой визуальной техникой (кино, дизайн, графика и тд) учат "насматриваться". Ты тупо поглощаешь много визуала. И потом его перемалываешь у себя в голове и выдаешь что-то. Или очень похожее, или не очень. А все началось, когда человек "насмотрелся" на зверей и додумался нарисовать на скале оленя какого-нибудь. И понеслось.

Работу спецов по визуалу автоматизируют, да. Плохо это? Ну, как бы нет. Люди всегда чем-то занимались, целой толпой, потом приходил один станок/машина/алгоритм и оптимизировал толпу до одного оператора. И вам не нравится качество работы этого оператора, а не сам факт работы этой машины. При хорошем качестве и если вам не сказать, никто и не догадался бы.

Доступность делает всё только хуже, играм конец!

Alpha Zero. Без людей только лучше

Скажите это Сэму Энгу, автору Skate Story. Появление юнити как инструмента позволило таким людям делать то, что они хотят, практически в одного. И выпустить все в цифре.

2
5 комментариев