Audiobox: Удивителният AI на Meta за клониране на гласове

аудио кутия

Meta Той успя да удиви всички с проекта си Audiobox, генеративен изкуствен интелект, способен да възпроизведе човешки глас от няколко секунди аудио. Това не е от онези проекти, които изглеждат много добре на хартия и след това се обезсмислят, защото съобщението е придружено от публична демонстрация на тези възможности.

Освен гласове, Audiobox може също да генерира уникални звуци чрез гласови или текстови указания. В тази публикация ви казваме всичко, което е известно досега за този проект и, най-доброто от всичко, как можете да го изпробвате сами.

Какво е Audiobox?

Audiobox е името, избрано за обозначаване на основния модел за търсене на Meta аудио генериране. Създаването на персонализирано аудио, което може да се прилага в различни ситуации и сценарии, е резултат от комбиниране на гласово въвеждане и текстови подкани на естествен език.

Както Мета обясни чрез изявление, това е плод на много усилия и години на изследване. И само първият камък от цял ​​нов свят от възможности, който се отваря пред нас.

Важността на това стартиране не трябва да се оценява само в „какво“, но и в това кой стои зад проекта. Не трябва да забравяме това Meta е компанията, която контролира някои от най-използваните приложения в Испания, като Facebook, Instagram или WhatsApp. Това отваря вратата към внедряване на тази нова технология в тях за не твърде дълъг период от време.

Какви възможности предлага Meta Audiobox AI?

аудиобокс мета

Audiobox ни носи шест уникални функции основан на изкуствен интелект за създаване и редактиране на аудио. Те предоставят на наше разположение широк набор от опции за персонализиране. Те са следните:

  1. Създаваме аудио с нашия собствен глас, въз основа на всяка кратка аудио извадка, дори дълга няколко секунди. Тази функция ни позволява да създадем реч, която имитира тона и стила на нашия собствен глас или този на друг човек.
  2. Описани гласове. Аудиото се генерира от поредица от указания, описани в текст. Най-хубавото в това е, че прави възможно създаването на нови и уникални гласове.
  3. Преработени гласове. Идеята е да промените тона и стила на истински глас с помощта на текстово описание. Можем да кажем, че това е комбинация от двете предишни функции в полза на още по-високо ниво на персонализиране.
  4. Звукови ефекти. В допълнение към гласовете, Audiobox от Meta е в състояние да генерира звукови ефекти от описателен текст.
  5. магически аудио редактор, удобен инструмент за премахване на досадния фонов шум от гласови записи.
  6. звуково запълване. Функция, чрез която да замените част от аудио нови звуци.

Както виждате, Audiobox предлага много възможности за аудио професионалисти и създатели на съдържание, въпреки че също е много интересен за всеки любознателен потребител. Засега гласовите актьори могат да бъдат спокойни, тъй като с оглед на резултатите, Гласовете, генерирани от този AI, все още са малко роботизирани, лишени от естественост. Въпрос на време е обаче тези малки неудобства да бъдат преодолени.

Как да пробвам Audiobox

тест на аудиобокса

Най-добрият начин да тестваме тази нова технология е да я изпробваме сами. Това е възможно чрез уеб демонстрация Аудиокутия, създаден наскоро и все още достъпен напълно безплатно. Начинът да опитаме е следният: запишем собствения си глас (или пуснем някой друг) и започнем да репетираме с него. Това е само една от възможностите, които тази технология ни предлага.

Въпреки че тази страница за тестване е достъпна в Испания, в момента може да се използва само на английски език, Това е езикът, който ще трябва да използваме, за да поискаме текстове и да генерираме аудио. Изпробвахме един от наличните женски гласове с фразата „Това е гласов тест за уеб Movilforum“ и това е резултата:

Злоупотреба с Audiobox на Meta и други тревожни проблеми

Една от най-изненадващите характеристики на Meta Audiobox е способността да генерираме собствен глас чрез този инструмент с изкуствен интелект. Но в същото време поражда много съмнения и несигурност, защото за него планира заплахата от възможна злоупотреба.

За да се предотврати използването на тази технология извършват измами или измами, Meta изисква приемане на редица условия за използване, преди да ни позволи да тестваме тази функционалност.

Освен това, генерираните аудиозаписи имат своеобразен "воден знак", който позволява прецизно проследяване на произхода им. В прессъобщението, което споменахме по-рано, Мета обяснява, че това отличително нещо всъщност е сигнал, който е незабележим за човешкото ухо, но може да бъде открит.


Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговаря за данните: Actualidad Blog
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.