Почему все сходят с ума с гонениями на AI-контент

Теперь бросаются на любой текст с адекватной структурой.

Почему все сходят с ума с гонениями на AI-контент

Задайте ChatGPT простой вопрос:

«Какова структура evergreen материалов?».

Ответ вас удивит.

Там будут и заголовок, и подзаголовки, и даже списки, а ещё и вывод. И такие статьи пишутся преимущественно людьми. Также такая структура отлично подходит для больших журналистских статей (в основном — расследований, списков, блогов, исследований, а также условно в интервью), поскольку это полезно для SEO-оптимизации.

А примеры будут?

Вот статья на ESPN про молодого футболиста из Ливерпуля, которую комфортно читать: там есть разделы (сильные стороны / над чем надо поработать / цитаты о нём / вывод = что ждёт игрока в будущем). Это позволяет «просканировать» статью и понять, что важно и интересно лично мне в ней. Если зацепит — прочитаю всю. Либо прочитаю только тот раздел, ради которого я зашёл.

Обратите внимание на очевидный маркер ИИ — длинные тире. Ловите робота! 
Обратите внимание на очевидный маркер ИИ — длинные тире. Ловите робота! 

Спорт не всем близок, понимаю. Но это сайт про технологии, верно? Вот статья на TechCrunch. Что иронично — статья как раз про GPT. Тут небольшой отход от структуры, но такое же разделение на подразделы, с мелким введением. Если же перейти к последним трём абзацам и прочитать их, то вы получите классическое заключение: вывод и подведение итогов статьи, просто не выделенные подзаголовком.

Что-то на искусственно-интеллектуальном
Что-то на искусственно-интеллектуальном

А, вспомнил. Это же видеоигровой сайт. Тогда будем честны — половина контента на IGN может быть по логике местных ненавистников ИИ сгенерирована GPT. Причём ещё до появления GPT — фанаты PlayStation, смахивайте ностальгическую слезу с этими яркими примерами из 2013-го, когда из эксклюзивов на PS3 вышли «The Last of Us», «Sly Cooper: Thieves in Time», «Puppeteer», «Beyond: Two Souls», «Gran Turismo 6». Величие.

Великая игра, кстати. И одна из немногих платин, потраченного времени на которые не жаль
Великая игра, кстати. И одна из немногих платин, потраченного времени на которые не жаль

Если кто-то возразит «Да так уже 100 лет не пишут!» — 12 лет прошло, а IGN и ныне там. Те же списки, тот же стиль.

Почему так происходит?

Есть ещё один вопрос, который вам нужно задать GPT, раз вы так не любите ИИ, но постоянно сверяетесь и ищете доказательства именно там.

«На текстах в каких стилях тебя обучали?»

Конечно, открытых источников нет и реальной картины мы не получим, но сама модель отвечает так:

Почему все сходят с ума с гонениями на AI-контент

Суммарно, по оценке ChatGPT выходит, что примерно 45-95% базы, на которой обучали модель — это материалы, которые имеют строгую структуру. В журналистских статьях и блогах допустим уход в более «литературный» стиль, и там может быть просто «opinon journalism» со сплошной стеной текста (что я не очень люблю, но тоже работает).

Ответ, почему вам кажется, что каждый текст вокруг выглядит, как ИИ — на поверхности (Уберите детей от экрана, сейчас будет список):

* Моделям нужно на чём-то учиться, а это «что-то» было создано человеком — статьи, блоги, лонгриды.

* ИИ не нужны эмоции. Его задача — отвечать на вопросы и оперировать фактами, поэтому важна чёткая структура, присущая довольно сухим seo-оптимизированным статьям.

* Художка — про эмоции и не имеет логичной структуры, поэтому пользы для обучения ИИ даёт не так много. Однако помогает варьировать стиль.

* Многие произведения худ. литературы находятся под копирайтом, что усложняет использование для обучения моделей. Тут мы берём в расчёт идеальную картину мира, где все подчиняются законам, конечно же, лол.

При объективном засилье ИИ-контента повсюду глаз хорошенько «замыливается», и если на картинках определить генеративный конент несложно, то с текстом ситуация куда хуже.

Что делать авторам?

У кого-то есть профдеформация из-за работы, кого-то учили писать суше, кто-то насмотрелся блогеров и нахватался «вредных советов». Поэтому те, кто пишут вообще без использования ИИ находятся в невыгодной ситуации: напишешь сам — обвинят в использовании ChatGPT, ведь твой стиль похож на ИИ.

Контраргументов, что смешно, в такой ситуации даже нет. Я проверял свои статьи, написанные на английском до выпуска публичной веб-версии ChatGPT (2022 год) на наличие в них паттернов ИИ. И большинство популярных детекторов находило там следы ИИ (в каких-то текстах 20%, в каких-то даже 60% и больше). Что нужно делать, так это адаптироваться к новой реальности.

Что будет дальше?

Главными здесь станут читатели, конечно же. Вас хочется попросить об одном: постарайтесь отличать хороший контент от плохого, а эти два уже от ИИ, если это так важно. Я считаю, что если контент действительно был качественным, и вам не жаль времени, которое потратили на прочтение — цель достигнута, и жаловаться уже не стоит. Был он написан человеком, или же человеком, которому помогал ИИ — уже не так важно. Это, в первую очередь, развлекательный контент. Вы, как читатель, не теряете от того, что прочитали увлекательный текст, пропущенный через ИИ. Мы, конечно же говорим о тех текстах, которые постоянно «подозревают», но где видно несколько важных отличительных черт: их отредактировал и проверил на факты человек, добавил туда свои мысли и стиль.

Почему все сходят с ума с гонениями на AI-контент

Если же это откровенно плохой сгенерированный текст, в котором нет никакого личного участия, то вопросов нет — гоните таких, насмехайтесь над ними, выплесните злость в комментах. Такого и правда много, боль разделяю. Только не надо пушить такой контент реакциями тогда, ведь даже негативными смайлами вы двигаете статьи вверх.

Также не забывайте, что «волшебной кнопки» ни в одном ИИ нет. А те, кто такое обещает — нагло врут. Любой качественный (подчеркну) ИИ контент — это всегда синтез работы человека и машины. Она не напишет симфонию за человека, только «скелет», в котором ещё нужно проверить не перепутаны ли тазовая кость и череп местами. И если вы вновь встретите статью, которая вам понравилась, от которой получили пользу, чувствуется авторский стиль, но вот блин подозреваете наличие ИИ в ней и всё, то задумайтесь: может стоит хотя бы на секунду расслабиться и вспомнить, что это развлекательный портал?

9
33 комментария