Геният на играта "Го" се отказва! Безсилен е срещу компютъра, който се научи да мисли и да твори

Миналата седмица южнокорейският майстор на играта Го и един от най-титулуваните играчи в света, Лий Седол, обяви оттеглянето си със следното изявление: "След като изкуственият интелект започна да играе Го, разбрах, че няма как да бъда най-добрият, дори и да оглавя ранглистата след безумни усилия. Сега има сила, която не може да бъде преодоляна."

Лий говори за компютъра AlphaGo, разработен от компанията DeepMind, която преди пет години бе купена от Google за 650 милиона долара. Кореецът загуби от машината още през 2016-а и оттогава изкуственият интелект е станал още по-съвършен в играта.

А успехът на компютъра над човек в Го се счита за истински пробив, който потенциално би могъл да доведе до мащабни промени в световен мащаб.

Програмистите отдавна тестват силата на изкуствения интелект в сложни игри с възможно най-подготвените хора. През 1997 г. разработеният от IBM компютър Deep Blue победи Гари Каспаров в революционна партия шах. Преди мача гросмайсторът заяви: "Това е само машина, а машините са глупави." Но след поражението си призна: "Усетих го, усетих го! На масата срещу мен беше нов тип разум".

За да победи Каспаров, Deep Blue използва брутална изчислителна мощност: след всеки ход програмата изчисляваше всички възможни сценарии и вземаше решенията въз основа на тези изчисления.

Но при Го този подход не работи поради огромното количество данни, които трябва да бъдат обработени. Върху дъската за Го е начертана квадратна решетка от линии. Официалният размер на решетката е 19x19 линии, но правилата могат да се прилагат за всякакви размери. За начинаещи играчи се препоръчват малки дъски с размер 9х9 или 13x13 линии, а напредналите, както и професионалистите, играят на 19х19. Играе се с фигури, които представляват бели и черни камъчета. Те се поставят върху пресечните точки на линиите.

С оглед размера на дъската са възможни 361 опции за първия ход, който правят черните камъни (в шаха са само 20). С всеки ход потенциалните развои на играта само растат. След първите два хода в шаха има 400 възможни разработки, а в Го - 129 960. Математикът Джон Тромп изчислява, че възможните комбинации в играта са 171-цифрено число.

Затова от състезателите се изисква не само огромен интелект, но и развито абстрактно мислене и силна интуиция - качества, които са слабо развити при компютрите.

Един от разработчиците на AlphaGo, Демис Хасабис, казва: "Това е много интуитивна игра. Майсторите на Го често казват, че са направили един или друг ход, защото им е изглеждал правилен." Според него майсторите развиват специално естетическо усещане за случващото се на дъската.

Процесорите стават все по-мощни и по-бързи, но допреди няколко години изкуственият интелект не можеше да надскочи нивото на играч-любител.

През 2014 г. Дейвид Фотланд, един от пионерите на компютърното Го, каза, че програмите са изправени пред същия проблем, пред който и хората: "Много играчи достигат определен любителски връх и не могат да станат по-силни. За да го направят, трябва да постигнат някакъв интелектуален и психологически скок, а програмите имат същите проблеми. Трябва да се гледа цялата дъска, а не само локалните битки."

За да преодолеят тази интелектуална бариера и да симулират интуицията и естетическото усещане на професионалистите, разработчиците на AlphaGo са свързали невронни мрежи (процесорни и софтуерни мрежи, които симулират работата на човешките мозъчни неврони) и алгоритми за задълбочено обучение.

Отначало невронните мрежи AlphaGo бяха захранвани от база данни с човешки игри, която включваше приблизително 30 милиона хода. След това компютърът бе обучен да прогнозира вярно хода на човек в 57% от случаите, което бе ръст с 13% спрямо предишния рекорд (44). Тогава разработчиците научиха AlphaGo да играе срещу себе си. Така компютърът се научи да изолира по-добре най-печелившите ходове и да разработва нови стратегии.

Всичко това помогна за рационализирането на процесите, използвани от победилия Каспаров компютър Deep Blue. Сега системата не само възпроизвежда всички възможни комбинации, но и е в състояние да се съсредоточи върху най-перспективните сценарии. Освен това се ориентира в ситуации, с които никога не се е сблъсквала. Благодарение на новата стратегия AlphaGo отвя конкуренцията на всички създадени преди това компютърни играчи на Го и започна да побеждава професионалните състезатели.

През октомври 2015 г. AlphaGo разгроми двукратния европейски шампион Фан Хуей от Франция. Изиграха се пет партии, като и петте бяха спечелени от машината. Това беше и първият път, в който компютърът записва успех над професионалист. След мача Хуей заяви, че е "научил много от компютърния съперник".

През 2016 г. AlphaGo изигра и пет партии с Лий Седол, налагайки се над южнокорееца с 4:1. Двубоят предизвика огромен интерес в Азия и само в Китай бе гледан от на 60 милиона души.

Срещата се оказа исторически по редица причини.

Както и Каспаров през 90-те, така и Лий преди три години не беше подготвен за това колко добре може да играе компютърът. Твърди, че е загубил първата партия заради подценяване. Във втория мач машината демонстрира и придобитата креативност.

Този момент влезе в историята на играта Го като "Ход 37". На много коментатори им изглеждаше грешен, но се оказа брилянтен.

Фан Хуей, който бе съдия на мача, заяви: "Това не е човешки ход. Никога не съм виждал нещо подобно от човек. Толкова красиво беше."

След мача пък Лий сподели: "Мислех, че ме очаква много ефективна машина, която ще изчисли най-добрия ход за всяка конкретна ситуация въз основа на запазените данни. Но някои от ходовете ми се сториха много креативни. Те демонстрираха красота, която само хората могат да създадат."

Този ход даде да се разбере, че AlphaGo не само може да смята, но и да мисли. По принцип машината играе консервативно, но 37-ият ход не беше консервативен. По-късно разработчиците на интелекта дълго умуваха над въпроса защо машината е избрала да играе така. Лий също бе озадачен по време на срещата и мисли над 15 минути как да отвърне на компютъра. След втората партия заяви, че нито за секунда не е имал чувството, че той води играта.

Същата бе ситуацията и в третия двубой.

В четвъртия мач южнокореецът показа, че човешката креативност може да наруши работата на алгоритмите.

Към този момент той вече губеше с 0:3 и едва не се разплака, когато се извиняваше на сънародниците си, че не може да се справи с AlphaGo. Смяташе, че компютърът го превъзхожда в способността да изпълнява ходове, с които постепенно да трупа малко предимство. Затова на 78-ия, след половин час размисъл, измисли нещо, чиято вероятност да се случи бе 1 на 10 000.

В резултат на това машината не успя да се възстанови от изненадата, направи няколко грешки и загуби. Тънките познавачи на Го пък за пореден път се убедиха, че Лий е гений.

Разработчиците на AlphaGo разнищиха подробно поражението и ход 78, продължиха да работят върху алгоритъма и през 2017 г. пуснаха актуализирана система за игра с професионалисти онлайн.

Резултатът ли?

60 победи за компютъра, нула загуби и едно равенство след пропадането на интернет връзката на потребителя. Модернизираният AlphaGo записа 100 победи от 100 партии срещу предшественика си, като същевременно използва много по-малко оборудване и изчислителна мощност.

Прогресът на машината очевидно не е по вкуса на Лий, но мнозина смятат, че разработката може да бъде от полза за човечеството. Ни Вейпинг, друг от корифеите на Го, след като загуби от AlphaGo в интернет, каза: "Това изобщо не е проста игра и хората все още имат много какво да изследват в нея. И Бог изпрати тази машина, за да помогне на хората да го направят."

Друг китайски гросмайстор, Ке Джи, също посочи възможните ползи: "Изучавах програмата и нейните теории половин година, след което започнах да прилагам всичко това на практика. От хиляди години хората се развиват в играта, но сега компютрите ни показват, че не разбираме нищо. Мисля, че все още никой дори не се е доближил до това да разбере какво точно е Го."

Сега този компютър вече се счита за най-добрият играч в света и не е ясно дали някой някога ще разбере напълно философията на играта, както отбелязва Джи. Но разработчиците имат други цели.

Екипът на DeepMind подчертава, че изкуственият им интелект далеч не е единствено шампион по Го и в бъдеще ще бъде използван за неща, които нямат нищо общо с играта.

Експертите посочват, че интелектът може да доведе до пробив в робототехниката, научните изследвания и в ежедневието. Учените дори обещават, че невронните мрежи ще могат да пишат музика и книги не по-лошо от хората.

Няколко години след победата над Лий обаче все още няма реални ползи за човечеството от AlphaGo. Нещо повече - DeepMind затъва финансово и през миналата година загубите на компанията надхвърлиха половин милиард долара. Ето защо някои експерти имат опасения, че ако изкуственият интелект не направи монетизиран пробив в близко бъдеще, балонът може да се спука и да спрат инвестициите в тази област.

Ще видим как ще се разият нещата, не можем да гадаем. Но едно е сигурно - с кариерата на Лий Седол като играч на Го е свършено. Кореецът все още съветва разработчиците на AlphaGo и по-късно този месец ще играе с корейския компютър HanDol. Но не си прави илюзии. "Знам, че нямам шанс", твърди играчът.

Лий може и да е сред гениите на най-трудната настолна игра, но само в света на хората.

Новините

Най-четените