Този сайт използва „бисквитки“ (cookies). Разглеждайки съдържанието на сайта, Вие се съгласявате с използването на „бисквитки“. Повече информация тук.

Разбрах

"Швейцарско ножче за звук": Нов ИИ модел на Nvidia създава нечувани до момента звуци

Искате ли да чуете лаещ тромпет? Е, и да не сте искали, сега ви е любопитно. Снимка: Microsoft Copilot
Искате ли да чуете лаещ тромпет? Е, и да не сте искали, сега ви е любопитно.

Как би звучал лай на тромпет? Или мяукане на саксофон? Трябва само да попитаме с няколко реда текст.

Отговорът идва от нов софтуер, дело на екип от изследователи в областта на изкуствения интелект (ИИ) към технологичния гигант Nvidia.

Техният модел Fugatto може да "генерира или трансформира всяка комбинация от музика, глас и звуци", след като потребителят е обяснил какво иска посредством текст и/или аудиофайлове.

Моделът, чието име е съкратено от Foundational Generative Audio Transformer Opus 1, според Nvidia може да се използва в редица области и е способен на голям набор от задачи. Неслучайно го определят като "швейцарско ножче за звуци".

Може да създаде музика от текстови напътствия (готови ли сте за български рап парчета, генерирани от ИИ вместо от скромен ЕИ?), да добавя или премахва инструменти от съществуващи песни, както и да променя акцента или емоцията на глас.

Изтъква се и възможността да създаде "звуци, които никога преди не са били чувани" - като гореспоменатите примери с инструменти, издаващи животински звуци.

Бъдещето на музиката?

От Nvidia дават за пример възможността музиканти и продуценти да ползват Fugatto, за да създадат прототип на своя идея за песен или да редактират такава. Софтуерът ще им позволи да тестват как тя ще звучи в различни стилове, с различни гласове и с различни инструменти.

Друга възможна употреба ще е добавянето на ефекти, за да се подобри звука на вече съществуващ запис.

Музикалният продуцент Айдо Змишлани, който работи с Nvidia, обяснява колко значими ще са технологиите с изкуствения интелект за бъдещето.

"Историята на музиката е история на технологията", обяснява той. "Електрическата китара даде на света рокендрола. Когато се появи семплъра, се роди хип-хопът. С изкуствения интелект пишем следващата глава [в историята] на музиката. Имаме нов инструмент за създаване на музика и това е супер вълнуващо", допълва Змишлани.

Но ползите от подобен модел с ИИ са не само в сферата на музиката.

От реклама до кино

Друга примерна употреба е от рекламна агенция - чрез Fugatto може рекламна кампания да се претвори за различни региони, като гласовете в нея се сдобият с различни акценти или емоции.

Nvidia дават пример и с възможността курс за изучаване на език вече да звучи не с предварително записан глас на учител, а с генерирано от ИИ копие на гласа на родител или приятел.

Тук може да се видят няколко различни теста на модела, сред които и възможността да генерира глас с различен акцент и настроение:

Приложението в сферата на игрите пък е, че тъй като там различните действия на играчите могат да водят до различни последствия, софтуер като Fugatto ще може да генерира и променя репликите на околните персонажи.

Друг тест показва възможността на модела с ИИ да генерира звука на "отслабваща гръмотевична буря със звука на пеещи птици" или на влак, чийто звук се превръща в симфонична мелодия - възможности, които могат да повлияят на киното и телевизията.

Какво крещи?

Естествено, има ги и чистите експерименти с "нечувани до момента" звуци. "Каквото потребителите могат да опишат, това може да създаде моделът", твърдят от Nvidia.

Макар Fugatto все още да не е достъпен за публични тестове, има сайт, в който са качени редица примери за генерирани с него звуци - от рап песен (гласът е генериран от самия софтуер), през "заводски машини, които крещят в метална агония", до вече споменатите лаещи инструменти.

Някои резултати са добри, други - не чак толкова, но има такива, на които спокойно може да бъде залепен етикетът стряскащи.

Като крещящото виолончело...

Задоволи любопитството си по най-удобния начин - абонирай се за седмичния ни бюлетин с най-интересените статии.
 

Най-четените