Ссылки

Новость часа

"Вал фейковых видео, фото нас захлестнет в ближайший год-два". Эксперт объясняет, на что уже способны нейросети и чего от них ожидать


Папа римский в пуховике. Фото, созданное нейросетью
Папа римский в пуховике. Фото, созданное нейросетью

26 марта СМИ и телеграм-каналы обратили внимание на аудиозапись, на которой, предположительно, музыкальный продюсер Иосиф Пригожин и российский сенатор Фархад Ахмедов ругают президента РФ Владимира Путина и его окружение, называя их "подонками" и "преступниками". Пригожин назвал это аудио фейком, сгенерированным нейросетью.

Через пару дней Илон Маск, Стив Возняк и более тысячи других экспертов и представителей IT-индустрии призвали приостановить обучение систем искусственного интеллекта более мощных, чем GPT-4, чтобы понять, как их контролировать. Они также подписали открытое письмо на эту тему. "Мощные системы искусственного интеллекта следует разрабатывать только тогда, когда мы уверены, что их эффекты будут положительными, а риски – управляемыми", – говорится в документе, разработанном Институтом будущего жизни (Future of Life Institute).

Может ли искусственный интеллект уже создавать правдоподобные подделки? И представляет ли опасность для человечества развитие технологий в части распространения дезинформации? В эфире Настоящего Времени мы попытались разобраться в возможностях нейросетей вместе с Сергеем Немчинским, ютуб-блогером, CEO и владельцем учебной компании foxmindEd.

На что способны нейросети – объясняет эксперт
пожалуйста, подождите

No media source currently available

0:00 0:09:49 0:00

– Давайте сначала поговорим про кейс Пригожина и Ахмедова. Пригожин говорил, что это все нейросети. Я хотел вас спросить: способны ли нейросети воссоздавать телефонные разговоры и голоса людей?

– В принципе, способны. Тут надо просто понимать, что есть огромное количество всяких моментов, на которые достаточно обратить внимание, чтобы понять, что это не подделка. Конечно же, нейросеть может генерировать разговор, но, во-первых, не такой длительности, потому что генерация разговора такой длительности заняла бы бесконечное время. Ну и куча других особенностей, на которые в том числе Люся Штейн обратила внимание. Плюс надо же понимать, что если бы это был фейк, то его было бы гораздо лучше сделать не с такими не особо значимыми фигурами, а поставить какого-нибудь Кадырова или еще какое-то лицо, которое прогремело. А то какой-то Пригожин – звучит это по-детски.

В моей стране заблокировали

Настоящее Время

– Вы говорите, что такой длительности нельзя бы сгенерировать. А какую длину нейросети могли бы сгенерировать?

– Там же вопрос не в том, чтобы генерировать именно длину. Вопрос в том, чтобы просчитать все эти детали. На самом деле, если вы игрались c ChatGPT, наверное, знаете, что когда его просишь что-нибудь сгенерировать, он тебе генерирует какой-то кусок. И поначалу это просто ахинея. Нужно уточнять, сказать: "Вот это поправь. То поправь". Для того чтобы делать получасовое видео, потребовался бы, наверное, месяц или два, чтобы сидеть и уточнять каждую из деталей. Плюс все равно бы остались шероховатости, все равно бы остались моменты, за которые можно было бы зацепиться. А полчаса – совершенно точно там было бы огромное количество шероховатостей. Просто не было бы смысла делать такое длинное видео. С точки зрения фейка было бы достаточно трех-четырех фраз. И что бы мы тогда делали? Там уже не за что зацепиться было бы.

– И тогда Пригожину было бы это сложно опровергать. То есть сейчас это реально?

– Да.

– Давайте теперь поговорим про фотографии. Это фотография папы римского в пуховике. Как вообще возможно воссоздать такой реалистичный снимок?

– Тут я не вижу вообще никакой проблемы. Любой дизайнер с помощью фотошопа сделает вам что-то похожее. Нейросеть, естественно, работает лучше, чем фотошоп, и может сделать наложение двух фотографий гораздо более осмысленным.

Опять-таки, в любом случае полезут разные артефакты. В данном случае это кружка, влезшая в руку, куда-то пролезающее ухо. И таким способом мы легко определяем, где генерируемое изображение, а где настоящее. Серьезно, как могло ухо пройти сквозь куртку? В реальной фотографии такое было бы невозможно.

– Еще вы наверняка видели другую фотографию, которая ходила по интернету пару недель назад, когда в Москву приезжал Си Цзиньпин. И там на снимке якобы Путин целует руку Си Цзиньпину. Но это тоже нейросети, правда?

– Я надеюсь, что да. Давайте будем честны: с точки зрения здравого смысла мы не можем себе представить такую картинку. Это выглядит слишком. Даже если бы такое в реальности произошло, то нам такую фотографию просто бы не опубликовали. Я сомневаюсь, что там вокруг бегают какие-то оппозиционные фотографы.

– У этого снимка тоже есть детали. Я обратил внимание, что на этой фотографии у Путина и Си неестественно большие головы. На фото папы римского, как вы заметили, не очень реалистична эта емкость, которую он держит. Я вас хотел в этой связи спросить: может ли работа нейросетей стать еще более совершенной? Могут ли нейросети прийти к тому моменту, когда изображение будет не отличить от настоящей фотографии?

– Не только могут, но и совершенно точно придут рано или поздно. Понимаете, если попросить нейросеть сгенерировать 100 фотографий, то из них две-три фотографии будут выглядеть реалистично. Потом это будет пять фотографий, потом 10, потом 95. Но все равно будут фотографии, которые будут ловиться на каких-то таких деталях, когда один объект проходит сквозь другой или еще какие-то аспекты, за которые человеческий глаз зацепится и скажет: "Блин, ну серьезно". Это шесть пальцев, например, или еще какой-то аспект, который явно покажет, что фотка – фейк. Но постепенно находить фейки будет все сложнее и сложнее. Я вообще уверен, что постепенно появится искусственный интеллект, который будет определять: генерировал ли искусственный интеллект это изображение или текст.

– Если говорить про дальнейшее развитие всей этой истории, что дальше? Сейчас уже есть технология дипфейк. Эта технология касается видео, когда на лицо говорящего человека накладывается маска с лицом любого другого человека. По-вашему, такое развитие технологий представляет опасность в части распространения дезинформации?

– Конечно, представляет. Тут вопрос даже гораздо более общий. Вообще человечество совершенно не готово к этим вызовам, которые нам приносит искусственный интеллект. И вопросы правообладания, например, если искусственный интеллект сгенерировал изображение, – кому оно принадлежит? Очень спорный момент, особенно если это изображение взято из двух-трех предыдущих изображений. Там уже начинаются вопросы по правообладанию. Опять же, по подлинности и куча других вопросов. Я думаю, что нас ждет огромная революция именно с точки зрения юриспруденции: как законодательно правильно это все оформить, как подтвердить подлинность вещи и так далее.

Давайте будем честны: мы уже в начале новой промышленной и информационной революции. И к этому придется подстраиваться всем.

– Учитывая фотографии Путина и Си, я не могу отделаться от аналогий с романом Пелевина "Generation "П", где он в 90-х годах описывал, что по телевизору выступают голограммы. По-вашему, возможно ли такое, что нейросети будут использоваться в политическом смысле и политики будут моделироваться искусственно, мы будем видеть каких-нибудь политиков, посещающих какие-нибудь объекты, хотя они там не были?

– Что-то знакомое. Я думаю, это не только возможно – это абсолютно неизбежно. Причем неизбежно в очень кратчайшие сроки. Поначалу это будет, конечно, выглядеть жутким фейком, но постепенно все это будет более и более реально. Я думаю, что вал фейковых видео, фейковых сообщений, фейковых фотографий нас просто захлестнет в ближайший год-два.

– Так скоро?

– Я думаю, что в этом году, как вы видите, уже началось. Что вас удивляет?

– Вы сказали про некую юридическую плоскость. Как можно с этим бороться? Стоит ли это делать? Получится ли успешно с этим бороться?

– Человечество не первый раз встречает аналогичные вызовы. Поначалу люди работали вручную, у них была маленькая производительность, потом появились машины. Помните, луддиты их ломали – вот это все. Но человечество же как-то к этому подстроилось, научилось работать с машинами, научилось работать со станками с ЧПУ, с роботизированным производством и так далее. Человечество просто стоит на пороге огромного вызова. Но не в первый раз. Просто человечество через 10 лет будет очень сильно отличаться от сегодняшнего. Вот и все.

– Вы еще упомянули, что вы думаете, что появятся программы, которые будут распознавать фейки. Известно ли вам, какие-нибудь спецслужбы или кто-то еще сейчас занимается созданием этих программ для борьбы с фейками?

– Я не слышал про это, но совершенно очевидно, что это рано или поздно появится по причине того, что обрабатывать такой поток информации вручную просто невозможно. Вы же понимаете, человечество всегда придумывает меч и придумывает щит. Раз есть меч, значит, будет щит, который будет от него защищать. Все это идет параллельно.

– А есть какое-то полезное применение у нейросетей, чтобы они приносили нам не вред, а пользу?

– Конечно. Огромное количество полезных применений. Я абсолютно уверен, что любая профессия, связанная с творчеством, – от программистов до дизайнеров и художников – будет использовать искусственный интеллект как один из основных своих инструментов в ближайшие годы. И если вы сейчас работаете дизайнером, художником, музыкантом, начинайте уже сейчас использовать искусственный интеллект, потому что через несколько лет такие знания и умения – пользоваться искусственным интеллектом для генерации контента и правильно этот искусственный интеллект под себя настраивать – будут абсолютно необходимыми. И вы будете очень сильно обгонять конкурентов в своей же профессии. И это очень классно, это очень сильно повысит производительность и снизит расходы.

XS
SM
MD
LG