Почему все сходят с ума с гонениями на AI-контент
Теперь бросаются на любой текст с адекватной структурой.
Задайте ChatGPT простой вопрос:
«Какова структура evergreen материалов?».
Ответ вас удивит.
Там будут и заголовок, и подзаголовки, и даже списки, а ещё и вывод. И такие статьи пишутся преимущественно людьми. Также такая структура отлично подходит для больших журналистских статей (в основном — расследований, списков, блогов, исследований, а также условно в интервью), поскольку это полезно для SEO-оптимизации.
А примеры будут?
Вот статья на ESPN про молодого футболиста из Ливерпуля, которую комфортно читать: там есть разделы (сильные стороны / над чем надо поработать / цитаты о нём / вывод = что ждёт игрока в будущем). Это позволяет «просканировать» статью и понять, что важно и интересно лично мне в ней. Если зацепит — прочитаю всю. Либо прочитаю только тот раздел, ради которого я зашёл.
Спорт не всем близок, понимаю. Но это сайт про технологии, верно? Вот статья на TechCrunch. Что иронично — статья как раз про GPT. Тут небольшой отход от структуры, но такое же разделение на подразделы, с мелким введением. Если же перейти к последним трём абзацам и прочитать их, то вы получите классическое заключение: вывод и подведение итогов статьи, просто не выделенные подзаголовком.
А, вспомнил. Это же видеоигровой сайт. Тогда будем честны — половина контента на IGN может быть по логике местных ненавистников ИИ сгенерирована GPT. Причём ещё до появления GPT — фанаты PlayStation, смахивайте ностальгическую слезу с этими яркими примерами из 2013-го, когда из эксклюзивов на PS3 вышли «The Last of Us», «Sly Cooper: Thieves in Time», «Puppeteer», «Beyond: Two Souls», «Gran Turismo 6». Величие.
Если кто-то возразит «Да так уже 100 лет не пишут!» — 12 лет прошло, а IGN и ныне там. Те же списки, тот же стиль.
Почему так происходит?
Есть ещё один вопрос, который вам нужно задать GPT, раз вы так не любите ИИ, но постоянно сверяетесь и ищете доказательства именно там.
«На текстах в каких стилях тебя обучали?»
Конечно, открытых источников нет и реальной картины мы не получим, но сама модель отвечает так:
Суммарно, по оценке ChatGPT выходит, что примерно 45-95% базы, на которой обучали модель — это материалы, которые имеют строгую структуру. В журналистских статьях и блогах допустим уход в более «литературный» стиль, и там может быть просто «opinon journalism» со сплошной стеной текста (что я не очень люблю, но тоже работает).
Ответ, почему вам кажется, что каждый текст вокруг выглядит, как ИИ — на поверхности (Уберите детей от экрана, сейчас будет список):
* Моделям нужно на чём-то учиться, а это «что-то» было создано человеком — статьи, блоги, лонгриды.
* ИИ не нужны эмоции. Его задача — отвечать на вопросы и оперировать фактами, поэтому важна чёткая структура, присущая довольно сухим seo-оптимизированным статьям.
* Художка — про эмоции и не имеет логичной структуры, поэтому пользы для обучения ИИ даёт не так много. Однако помогает варьировать стиль.
* Многие произведения худ. литературы находятся под копирайтом, что усложняет использование для обучения моделей. Тут мы берём в расчёт идеальную картину мира, где все подчиняются законам, конечно же, лол.
При объективном засилье ИИ-контента повсюду глаз хорошенько «замыливается», и если на картинках определить генеративный конент несложно, то с текстом ситуация куда хуже.
Что делать авторам?
У кого-то есть профдеформация из-за работы, кого-то учили писать суше, кто-то насмотрелся блогеров и нахватался «вредных советов». Поэтому те, кто пишут вообще без использования ИИ находятся в невыгодной ситуации: напишешь сам — обвинят в использовании ChatGPT, ведь твой стиль похож на ИИ.
Контраргументов, что смешно, в такой ситуации даже нет. Я проверял свои статьи, написанные на английском до выпуска публичной веб-версии ChatGPT (2022 год) на наличие в них паттернов ИИ. И большинство популярных детекторов находило там следы ИИ (в каких-то текстах 20%, в каких-то даже 60% и больше). Что нужно делать, так это адаптироваться к новой реальности.
Что будет дальше?
Главными здесь станут читатели, конечно же. Вас хочется попросить об одном: постарайтесь отличать хороший контент от плохого, а эти два уже от ИИ, если это так важно. Я считаю, что если контент действительно был качественным, и вам не жаль времени, которое потратили на прочтение — цель достигнута, и жаловаться уже не стоит. Был он написан человеком, или же человеком, которому помогал ИИ — уже не так важно. Это, в первую очередь, развлекательный контент. Вы, как читатель, не теряете от того, что прочитали увлекательный текст, пропущенный через ИИ. Мы, конечно же говорим о тех текстах, которые постоянно «подозревают», но где видно несколько важных отличительных черт: их отредактировал и проверил на факты человек, добавил туда свои мысли и стиль.
Если же это откровенно плохой сгенерированный текст, в котором нет никакого личного участия, то вопросов нет — гоните таких, насмехайтесь над ними, выплесните злость в комментах. Такого и правда много, боль разделяю. Только не надо пушить такой контент реакциями тогда, ведь даже негативными смайлами вы двигаете статьи вверх.
Также не забывайте, что «волшебной кнопки» ни в одном ИИ нет. А те, кто такое обещает — нагло врут. Любой качественный (подчеркну) ИИ контент — это всегда синтез работы человека и машины. Она не напишет симфонию за человека, только «скелет», в котором ещё нужно проверить не перепутаны ли тазовая кость и череп местами. И если вы вновь встретите статью, которая вам понравилась, от которой получили пользу, чувствуется авторский стиль, но вот блин подозреваете наличие ИИ в ней и всё, то задумайтесь: может стоит хотя бы на секунду расслабиться и вспомнить, что это развлекательный портал?