Как нейросети постепенно засрут интернет (а точнее уже засрали)

Год назад я наткнулся на статью, которая предсказывала деградацию нейросетей и автор приводил интересную теорию:

● Нейросети обучаются на контенте из интернета, который по большей части делает человек.

● Качество итоговой работы нейросети на данный момент ниже, чем оригинальный контент живого автора. Логические и смысловые ошибки, а так же некое "отсутствие души".

● Несмотря на это, нейросети массово используют для создания контента. Растет количество некачественных материалов в интернете и нейросеть начинает брать эти данные для обучения.

● Из-за общего снижения качества "скармливаемой" информации, нейросеть начинает тупить, все чаще повторяя свои же ошибки и неточности.

Вот недавно я решил поиграть в Kenshi, вспомнить лор и почитать информацию о фракциях. И первая же статья которую мне выдает поиск Яндекса выглядит так:

▸ Я может быть какое то обновление пропустил, но про "Сеть" в Кенши не слыхал
▸ Я может быть какое то обновление пропустил, но про "Сеть" в Кенши не слыхал

Увидев этот странный текст, я из интереса перешел по ссылке, а там безумие в чистом виде!

▸ Даже в Kenshi есть свой филиал "Без баб"
▸ Даже в Kenshi есть свой филиал "Без баб"
▸ А как вам такое? Холодные осадки в Kenshi осознали себя и из погодных условий превратились во фракцию
▸ А как вам такое? Холодные осадки в Kenshi осознали себя и из погодных условий превратились во фракцию
▸ А Шеки решили позабыть свой культ битвы и стать торговцами тех-охотниками
▸ А Шеки решили позабыть свой культ битвы и стать торговцами тех-охотниками

Для тех кто еще не понял - эта статья написана нейросетями!

Написана убого, коряво, без намека на логику, но с нужными SEO элементами - тот самый информационный мусор. А самое забавное, что мусор вынесен на первую позицию поисковой выдачи Яндекса. Да что там, 5 из 15 ссылок на первой странице поиска вели на такие же плоды нейросетей разной степени бредовости.

И в этом ключевая проблема нейросетей - слишком высокая скорость генерации контента. Она априори будет выше, чем создание уникального контента от живого автора. Ужасное качество итогового продукта меркнет на фоне человеческой жадности и лени.

Какая задача у информационного контента в 21 веке? Решить проблему пользователя? Нет - привлечь трафик и желательно здесь и сейчас, ведь трафик это деньги. Поэтому количество такого контента будет расти в геометрической прогрессии.

Масштаб проблемы и как она будет решаться в будущем?

На мой взгляд ключевой момент - это умение отличать материалы живого человека и материалы сделанные нейросетью. И я говорю даже не про умение пользователя, а про умение машинных систем.

● Для самих нейросетей встает вопрос обучения. Chat-GPT потребляет информацию из интернета и недавно с него сняли ограничения 2021 года (все что вышло позже этой даты нейросеть не учитывала). Если на системном уровне не будет фильтра, то в обозримом будущем качество ответов заметно упадет, ведь они будут составляться на основе ошибочных материалов созданных нейросетью до этого.

● Google, Яндекс и другие поисковики в какой то момент столкнутся с недоверием аудитории, ведь перестанут решать основную задачу пользователя - поиск полезной информации. Пока что их инструменты оценки качества контента слишком примитивны, что доказывает пример приведенный в начале статьи (1/3 выдачи поиска загажена мусором нейросетей). Единственный возможный критерий отбора доступный в данной ситуации - отдавать приоритет оригинальным статьям от живого автора.

А что в итоге?

Я пишу эту статью для того, чтобы люди более критично относились к информации в интернете и поддерживали живых авторов. Экспертного контента в сети все меньше и нельзя позволить ему утонуть под лавиной бреда нейросетей. В конце концов за ошибкой человека стоит мыслительный процесс, а за ошибкой нейросети - случайный алгоритм. И пока что к человеку доверия больше, чем к машине.

Ждем, когда техно-жрецы найдут решение этой проблемы и оно вскроет еще десяток других. А пока подписывайся на мой гоблинский блог - тут много интересного про разработку игр и нейросети.

P.S. По поводу моего месячного отсутствия. Несмотря на навалившийся ворох дел - я не забрасывал изучение инструментов для разработки игр. Просто написание статьей не вписывалось в мое плотное расписание. В ближайшие пару недель постараюсь выложить новую статью про Godot.

ВСЕМ WAAAGH!

Как нейросети постепенно засрут интернет (а точнее уже засрали)
2929
71 комментарий

Лол, нейросеть научится писать нечитаемые SEO тексты ))) Новость прекрасна)

4

Новость не в этом. Новость в том, что скоро такими нечитаемыми статьями будет загажена большая часть поисковой выдачи и пользователю будет сложно найти нужную информацию.

И даже неизвестно что хуже, вот такие нечитаемые статьи или читаемые, но со случайной и недостоверной информацией. Потому что во втором случае человек даже не поймет, что принял за истину случайный машинный бред.

7

Забыл упомянуть, что статья написана нейросетью

4

11010000 10111111 11010000 10111110 11010001 10001000 11010000 10110101 11010000 10111011 00100000 11010000 10111101 11010000 10110000 00100000 11010001 10000101 11010001 10000011 11010000 10111001 00100000 11010000 10111010 11010000 10111110 11010000 10110110 11010000 10110000 11010000 10111101 11010001 10001011 11010000 10111001 00100000 11010001 10000011 11010000 10110001 11010000 10111011 11010001 10001110 11010000 10110100 11010000 10111110 11010000 10111010

4

Да, нейросети научились изворотливо врать и выдумывать, иногда выдавая отборный, псевдоправдивый бред, причем складно написанный.

Это беда...

2

Мы входим в век массовой дезинформации и информационного мусора. Казалось, что нейросети сделают информацию доступнее, а выходит наоборот усложнение поиска.

Хотели как лучше, получился скайнет)

4