Този сайт използва „бисквитки“ (cookies). Разглеждайки съдържанието на сайта, Вие се съгласявате с използването на „бисквитки“. Повече информация тук.

Разбрах

AI Coffee break: Какво е това невронна мрежа, за което всички говорят

Ден преди премиерата на новите Huawei Mate - нека надникнем в това, което се очертава да е акцент при новите устройства Снимка: Webcafe.bg
Ден преди премиерата на новите Huawei Mate - нека надникнем в това, което се очертава да е акцент при новите устройства

Човешкият мозък е удивителен. Все още обаче човечеството не е успяло да изучи изцяло как работи той и въпреки годините проучвания, технологичния напредък и непрестанното натрупване на знания, не знаем достатъчно за него. Но все пак имаме някаква представа.

Например - как мозъкът може да види буквата "а", изписана по десетки, стотици, дори хиляди различни начини, и в повечето случаи да каже това е именно буквата "а", а не "в" или "я". И ако това може да ви се струва лесно, нека вземем например едно куче - овчарка, шнауцер, кавалер кинг чарлз шпаньол, болонка, бигъл - повечето хора дори не могат да назоват точната порода на това, което виждат, но няма как да кажат на кучето - котка.

А как стана така, че дори телефонът в джоба ви успява да направи разликата между двете?

Тайната се крие в т.нар. изкуствена невронна мрежа, която ще се опитаме да ви обясним по прост начин. Този модел за обработка на информация е базиран на начина, по който работи мозъкът (оттам и името му) и представлява поредица от относителни елементарни изчисления, в които всеки един неврон отговаря за нещо конкретно.

Изкуствената невронна мрежа е измислена още през 50-те години като метод и в момента различните й варианти се използват активно както в изкуствения интелект, така и при машинното самообучение. Най-просто казано, тя се състои от няколко слоя - входен слой, който съдържа най-чистата информация, няколко скрити слоя, които я обработват и филтрират, и изходен слой, който представя резултатите.

Да вземем числото "3" - в електронен вариант то може да се състои от множество пиксели, за най-лесно - черни пиксели върху бял фон. В по-голям мащаб то се състои от две полукръгчета отворени от лявата страна - едно горе и едно долу. Числото 8 се състои от два кръга, 1 от една дълга права черта и друга къса под остър ъгъл спрямо нея и т.н.

Мозъкът ни е трениран с годините и успява да разпознае двата големи елемента на тройката, които, от своя страна, са изградени от множество по-малки елементчета.

За изкуствената невронна мрежа данните от всички пиксели, които изграждат числото, е информацията, която изгражда входния слой. Според структурата на мрежата, тя може да обработи всички тях и да ги насочи към втори "скрит" слой, който да ги класифицира на отделни мини-елементи - всяка завъртулка, права и тяхното място на картината се обозначават.

След като информацията веднъж е филтрирана, тя може да мине например през втори невронен слой, където да се активират само невроните, които отговорят за долен и горен полукръг. Тези два неврона ще изпратят информация към изходния слой, където ще се активира само този, който казва "Това е цифрата "3".

via Gfycat

А сега си представете всичко това, но с много по-голямо изображение, за което трябва да се разбере в реално време дали камерата вижда куче, котка, човек, цвете, залез... Невронната мрежа работи при този случай на подобен принцип, но на значително по-сложно ниво. Тя разделя елементите на снимките на база милиони изображения, които преди това са били анализирани с нея, и търси да открои малките елементи, за да ги свърже в по-голяма картина и накрая да открои какво има в нея.

Ако сте от хората, които се оплакват, че в последните пет-десет години нищо иновативно не се е случило при смартфон пазара, най-вероятно подминавате раздвижването именно при изкуствения интелект през последната година.

С Kirin 970 Huawei първи представиха NPU чип, който отговоря именно за това телефонът ви да пресмята невронни мрежи "на живо", още докато насочвате камерата на телефона си.

Вече много хора могат да видят как Mate 10, P20 или P20 Pro разпознава обекта пред камерата и оптимизира настройките на снимката, в момента на натискане на бутона.

При новия Kirin 980 NPU чиповете са два, а на представянето му дори загатнаха, че те ще успеят да се справят с разпознаването на обекта дори при снимането на видео. Тепърва ще видим какво точно са ни приготвили с излизането на първите два модела с този чипсет - на 16 октомври.

 

  • Представянето на серията Mate 20 можете да гледате ето тук на 16 октомври от 16 часа българско време.

 

Дори телефон от средния клас като Mate 20 Lite, без да използва отделен NPU, успява да се справи с разпознаването на обектите на снимката.

Важното е, че всичко това се случва на самото устройство, не изпращате никаква информация "в облака" към отдалечен сървър и на телефона ви не му е нужен интернет, за да го сметне - но за това повече в някоя от следващите AI Coffee Breaks.

Макар да ни е по-лесно да ви обясним невронните мрежи през работата, която вършат за разпознаване на изображения, трябва да отбележим, че те далеч не се използват само за това.

Нещо повече - при снимките те дори нямат нужда да се самообучават на самото устройство, защото са предварително обучени с милиони изображения. Но при използването им например за оптимизиране на работата на процесора, както и пазене на батерията, с всяко едно използване на заложената в телефона невронна мрежа тя се "учи" да предвижда какво ще бъде натоварването спрямо вашите персонални навици.

 

Най-четените