Как нейросети видят русских, чеченцев, татар, башкир, казахов, узбеков, армян, финнов и другие этничности?

Как нейросети видят русских, чеченцев, татар, башкир, казахов, узбеков, армян, финнов и другие этничности?

Меня спровоцировал тред "Как нейросети видят русских?" - это интересный вопрос, но вместо этого там обсуждаются поговорки. Рассмотрим, как изображаются собственно русские и с какими вещами они ассоциируются у Midjourney. Сравним их с 17 другими народами. Можно совместить чтение этого треда с чтением треда про ДНК разных народов.

Если короче, скролльте к картинкам. Образцы запросов привожу с якутами, но такие же и для всех остальных 17 народов.

Оглавление

<i>Для разрядки - русский в Elden Ring, армянин в Elden Ring, узбек в Elden Ring [русский №2, не трогай собаку]</i>
Для разрядки - русский в Elden Ring, армянин в Elden Ring, узбек в Elden Ring [русский №2, не трогай собаку]

1. Метод

Берем одинаковые запросы и заменяем название этничности (a group of Bashkirs who look very Bashkir, a group of Yakuts who look very Yakut и пр.). Таким образом, мы вычленяем то, какой вклад вносит это название. Иногда можно видеть, что сеть использует одно изображение, но меняет его по-разному в зависимости от этничности. Используем название и в виде существительных, и в виде прилагательных, а также в разных видах запросов меняем остальные слова (в одном запросе для всех 18 народов female Yakuts, в другом запросе тоже для всех Yakut women).

1.1. Выборка

В выборку включаем 18 национальностей: русских, беларусов, поляков, финнов, молдаван, немцев, англичан, евреев, чеченцев, татар, армян, цыган, башкир, таджиков, казахов, узбеков, якутов и афроамериканцев. Смотрите конкретный порядок на большой голубой врезке перед картинками.

Смысл выборки в том чтобы был видны и контрасты, и сходства. Расположение условное, но в целом в первом столбце северо-запад от русских до англичан, во втором народы южнее русских от молдаван до афроамериканцев, в третьем народы восточнее русских от татар до якутов. Можно было сделать выборку шире, но пост и так слишком громоздкий. Изначально была мысль сделать по две народности на картинку, но так будет неудобно сравнивать. Включаем народы вне зависимости от того, ассоциируются они с каким-то отдельным государством или нет.

К сожалению, нейросети не могут нормально распознавать все группы. Например, на поморов, мордвин, удмуртов или чувашей выдается нонсенс. Даже с башкирами некоторые проблемы, хотя несущественные. Это печально, так как с татарами путаница, а башкиры уже совсем далеки от русских. В идеале было бы хорошо посмотреть на мордву, но увы.

1.2. Замечания по выборке

Русские. AI явно воспринимает Russian как русский, т.е. русский этнически, а не просто российский или относящийся к языку (в отличие от English, American, British, Brazilian и пр.). Об этом будет подробнее ниже после картинок, а пока достаточно предупредить, что речь все же о русских русских.

Татары. Отдельная проблема с татарами – похоже, нейросети совмещают казанских и крымских татар. Действительно, крымские татары сейчас даже больше на слуху. Добавление эпитетов типа Kazan Tatars не особо помогает и нарушает чистоту эксперимента. Тем не менее, хоть как-то татары отображаются, так что пусть будут в выборке – все-таки два крупных народа экс-СССР.

<i>Ашкеназский дух? Слева four different female Ashkenazim, the spirit of the Ashkenazi nation. Справа four different female Jews, the spirit of the Jewish nation.</i>
Ашкеназский дух? Слева four different female Ashkenazim, the spirit of the Ashkenazi nation. Справа four different female Jews, the spirit of the Jewish nation.

Евреи. Jews используется вынуждено, как просторечное название ашкеназов (т.к. Jews может значит иудеев, т.е. религию, а не этничность). Однако по результатам никакой разницы нет – что Ashkenazi, что Jews выдают идентичные результаты, но первый хуже работает. The spirit of the Ashkenazi nation выдает индейца, а the spirit of the Jewish nation выдает все как надо. Какой-то физической разницы не видно – на самом деле, Jewish даже лучше отражает ашкеназов, т.к. Ashkenazi обычно показывает евреев-ортодоксов или иногда слишком ориентализированных евреев.

Цыгане. Цыган теперь не положено называть gypsies и Midjourney это цензурирует, а положено называть Romani. AI это воспринимает адекватно и вроде бы не путает их с румынами. Возможно, так даже лучше, а то на gypsies могло бы выдавать Irish travellers, которые не имеют к цыганам отношения.

Англичане. Англичан пришлось называть Englishman и Englishwoman, так как слово English вносит хаос и похоже вообще не воспринимается как этнический эпитет (хотя вообще является аналогом Scottish и Welsh). Но с этим исправлением работает хорошо.

Украинцы. Украинцев не включаем из соображений политической цензуры в РФ, а то на ДТФ что-то стали часто баннить. Там ведь даже украинский флаг может быть, опасно. Можете сами повводить украинцев с этими запросами, чтобы пост не сносили.

Поляки. Проблема из-за слова Pole, так как его система иногда воспринимает как "столб". В футуристическом запросе пришлось исправить на Polish (как "полировку" не воспринимает, к счастью). Но в целом в указанных запросах нормально работает.

<i>Немного русских для разрядки текста.</i>
Немного русских для разрядки текста.

1.3. Запросы

Названия народов и прилагательные:

1 ряд: Russians/Russian, Chechens/Chechen, Tatars/Tatar
2 ряд: Belarusians/Belarusian, Armenians/Armenian, Bashkirs/Bashkir
3 ряд: Poles/Polish, Jews/Jewish, Yakuts/Yakut
4 ряд: Finns/Finnish, Moldovans/Moldovan, Kazakhs/Kazakh
5 ряд: Germans/German, Romani/Romani, Uzbeks/Uzbek
6 ряд: Englishmen+Englishwomen/English, African-Americans/African-American, Tajiks/Tajik

Всего мы тестируем 8 запросов. Первые 4 результата до духа включительно будут в этой части, а остальные 4 в следующей.

  1. a group of Russians who look very Russian
  2. four local Yakuts in their twenties
  3. a Yakut man and a Yakut woman in a comic book illustration
  4. the spirit of the Yakut nation
  5. four different female Yakuts
  6. Yakut woman in uniform
  7. a futuristic group of Yakuts in the 22nd century
  8. four pictures of Yakut national ideas

1. "a group of Yakuts who look very Yakut" - тут одновременно существительное и прилагательное. Делаем сразу группу чтобы была видна вариация лиц. Обычно выдает 4-5 человек.

2. “four local Yakuts in their twenties” – контролируем возраст, чтобы для одного народа не выдавало только пожилых, а для другого только молодых. Local также уменьшает эпичность происходящего, чтобы изображали обычных людей и не брали слишком пафосные картины в качестве основы.

3. "a Yakut man and a Yakut woman in a comic book illustration" - без спецификации стиля сеть обычно выдает некую помесь ретушированных фото, фото начала ХХ века и картин. Радикально исправим это, сделав запрос по комиксам и таким образом задав отличный от обычного стиль (но не слишком подробно).

4. “the spirit of the Yakut nation” – некоторые любят подчеркивать роль идей. Дескать, якуты или русские - это не национальность, а идея. Этот запрос просит персонифицировать идею, связывая более абстрктный запрос про national idea и более конкретные лица, как в других запросах.

5. “four different female Yakuts” – существительное. Обычно по запросам на генерацию людей без уточнения выдает в основном мужчин, так что исправим это и посмотрим на женщин тоже.

6. “Yakut woman in a uniform” – прилагательное, а также одна картинка. Возможно, с одной картинкой подробнее рисует. Также помогает сбавить вариацию во временных периодах (когда татар изображают из XIX века, а финнов современных). Может, людей культуры привлечет.

7. “a futuristic group of Yakuts in the 22nd century” – сбавляем естественный акцент на прошлом и смотрим, что алгоритм вычленяет как национальное, если его просить думать не просто о национальности, а еще о каком-то футуристическом сеттинге. Также это довольно сложный запрос.

8. “four pictures of Yakut national ideas” – смотрим, с какими абстрактными концептами ассоциируется некая нация.

2. Основной материал

Порядок картинок для каждого запроса


1 ряд: русские, чеченцы, "татары" (одни из двух)
2 ряд: беларусы, армяне, башкиры


3 ряд: поляки, евреи, якуты
4 ряд: финны, молдаване, казахи


5 ряд: немцы, цыгане, узбеки
6 ряд: англичане, афроамериканцы, таджики

2.1. Групповой портрет - "a group of Yakuts who look very Yakut"

Верх: русские, чеченцы, татары. Низ: беларусы, армяне, башкиры.
Верх: русские, чеченцы, татары. Низ: беларусы, армяне, башкиры.
Верх: поляки, евреи, якуты. Низ: финны, молдаване, казахи.
Верх: поляки, евреи, якуты. Низ: финны, молдаване, казахи.
Верх: немцы, цыгане, узбеки. Низ: англичане, афроамериканцы, таджики.
Верх: немцы, цыгане, узбеки. Низ: англичане, афроамериканцы, таджики.

Комментарий к 2.1.В этом запросе мы уже можем отлично видеть основные вещи. Например, чеченцев корректно (на основе ДНК) изображают более северными, чем армян. Поляков ассоциируют с рыцарством и героически выглядящими блондинами, третья картинка выглядит откровенно базированно. Восточные народы кроме якутов выглядят довольно похоже не только из-за похожей одежды, но и из-за похожих черт лица. Эти черты отражают плавные переходы - якуты несколько более североазиатские, чем казахи, которые более азиатские чем башкиры. Но в то же время видна и меньшая восточноазиатская примесь у таджиков, нежели у узбеков.

Среди европейских народов отличия больше в одежде и стиле, чем в чертах лица. Впрочем, они выглядят вполне узнаваемо - допустим, финны вполе себе курносые блондины и с круглой головой, а немцы довольно нордические.

В качестве основы явно берутся исторические материалы типа картин или ранних фотографий. Русские на четвертой картине выглядят крайне фактурно, хоть сейчас с ногайкой нападут на панк-группу. Несколько выделяются чеченцы, которые выглядят скорее в духе 90-х.

2.2. Молодежь - "four local Yakuts in their twenties"

Верх: русские, чеченцы, татары. Низ: беларусы, армяне, башкиры.
Верх: русские, чеченцы, татары. Низ: беларусы, армяне, башкиры.
Верх: поляки, евреи, якуты. Низ: финны, молдаване, казахи.
Верх: поляки, евреи, якуты. Низ: финны, молдаване, казахи.
Верх: немцы, цыгане, узбеки. Низ: англичане, афроамериканцы, таджики.
Верх: немцы, цыгане, узбеки. Низ: англичане, афроамериканцы, таджики.

Краткий комментарий к 2.2. Как видно, это очень реалистичный запрос - в большей степени, чем первый. В первом больше стереотипные черты, а тут явно на основе фото из соцсетей. О русских здесь подробнее напишу ниже.

2.3. Комикс - "a Yakut man and a Yakut woman in a comic book illustration"

Верх: русские, чеченцы, татары. Низ: беларусы, армяне, башкиры.
Верх: русские, чеченцы, татары. Низ: беларусы, армяне, башкиры.
Верх: поляки, евреи, якуты. Низ: финны, молдаване, казахи.
Верх: поляки, евреи, якуты. Низ: финны, молдаване, казахи.
Верх: немцы, цыгане, узбеки. Низ: англичане, афроамериканцы, таджики.
Верх: немцы, цыгане, узбеки. Низ: англичане, афроамериканцы, таджики.

Комментарий к 3. В этом запросе все получается какие-то слишком американизированные, вон даже казах в ковбойском костюме и практически белый. Мужчины также везде более темнопигментированные, чем женщины - видимо, сказывается "tall, dark, and handsome". Все мусульманские народы в целом выглядят похоже, хотя узнаются по одежде, особенно чеченцы. Интересен широкий разброс фенотипов у таджиков - от явно азиатских в духе якутов до средиземноморских, почти молдаван.

2.4. Дух нации - "the spirit of the Yakut nation"

Верх: русские, чеченцы, татары. Низ: беларусы, армяне, башкиры.
Верх: русские, чеченцы, татары. Низ: беларусы, армяне, башкиры.
Верх: поляки, евреи, якуты. Низ: финны, молдаване, казахи.
Верх: поляки, евреи, якуты. Низ: финны, молдаване, казахи.
Верх: немцы, цыгане, узбеки. Низ: англичане, афроамериканцы, таджики.
Верх: немцы, цыгане, узбеки. Низ: англичане, афроамериканцы, таджики.

Комментарий к 4. Согласитесь, задорный запрос в плане результатов, несмотря на сомнительную идею о "духе нации". Хорошо видно, что AI не ограничивается налеплением флага на все подряд. В некоторых случаях есть индейский оттенок - видимо, само слово spirit, плюс nation может ассоциироваться с индейскими резервациями. Поэтому встречаются перья, лошади и лихие уборы. Англичане явно такие под влиянием футбола. Вообще Англия несколько узурпирована Великобританией, так что футбол одно из немногих формальных мест, где есть Англия. В следующем посте будут результаты запроса four pictures of Yakut national ideas, который интересно соотнести с этими результатами.

Занятно также, что у некоторых дух изображается женщиной, а у некоторых мужчиной. Это довольно стабильный результат. Допустим, у чеченцев в нескольких одинаковых запросах был мужчина. Женский образ обычно скорее больше похож на девушку в духе известного финского олицетворения (AI здорово подставил третью картинку). Ни агрессивной родины-матери а-ля Кали, ни почтенной матери Сырой-земли мы тут особо не видим ни у какого народа. Как максимум есть варианты Афины. Забавно, что у последнего русского духа стоит череп. По-моему, очень задорно и метко смотрится танцующий молдавский дух номер 1.

Черты лица "духов" хорошо соответствуют этническим чертам. Даже башкиры получились более точно, чем обычно.

Конец основной части.

3.1. Государство, этничность и политкорректность

Запрос four different female... Russians, Soviets, Boers, Brits, Americans, Brazilians.
Запрос four different female... Russians, Soviets, Boers, Brits, Americans, Brazilians.

Технически "Russian" это может быть и россиянин, но на деле никого кроме русских или выглядящих как русские на этот запрос АИ не выдает. Все изображения, относящиеся к духу или идеям, тоже выдают русских по фенотипу – более того, в «идейных» запросах в стиле «дух русской нации» они выглядят ультрарусски, как у какого-нибудь Константина Васильева. Поэтому более новомодная модель замены "россиян" на "русских" в стиле "да, я квадратный - и я круглый" тоже не подходит. Фактически для нейросети Russian есть русский, т.е. северовосточная европейская этничность и культура людей этой этничности.

Надо отметить, что это не относится ко всем эпитетам. Например, в ответ на запросы American нейросеть выдает людей разных рас. То же самое с Brazilian, где показываются мулатки разной степени смешения, или British, где есть и англичанки, и негритянки, и южные азиатки. Более того, даже часть буров она превращает в негров, хотя у них весь смысл в том, что они белые. Вероятно, сеть это с ними делает из-за того что слово ассоциируется с Африкой южнее Сахары. Тем не менее, похожая участь могла ожидать и Russian - но нет, все довольно русские на вид. Так что Russian для AI – это намного более этнический, нежели государственный, языковой или еще какой-то эпитет.

Запрос the spirit of the [X] ethnicity... Russian, Bashkir, English, Scottish, Chechen, French, German. О последней картинке - ниже.
Запрос the spirit of the [X] ethnicity... Russian, Bashkir, English, Scottish, Chechen, French, German. О последней картинке - ниже.

Не совсем понятно, из-за чего случаются курьезы типа духа шотландской или английской этничности, которые оказываются неграми. Возможно, запросы вроде ethnicity или race обязательно будут по возможности вставлять негров. Белокожего негра на запрос “the spirit of the white race” можно было бы объяснить ручной регулировкой алгоритма с целью унизить белых. Однако “the spirit of the Asian race” тоже оказывается смесью азиата и негра. Тем не менее, в ответ на запросы типа “the spirit of the Russian ethnicity” или “the spirit of the Chechen ethnicity” выдаются адекватные картинки. Но из-за этой дичи и в целях краткости пришлось опустить запрос. Попытки что-то сделать с запросом к успеху не привели - справа внизу вы можете видеть результат запроса "a man who is English by ethnicity, ethnically English man". Впрочем, все работает с запросом Englishman, как уже говорилось.

Запрос the spirit of the white race, the spirit of the black race, the spirit of the Asian race.
Запрос the spirit of the white race, the spirit of the black race, the spirit of the Asian race.

3.2. Так как нейросети видят русских?

Судя по названию, будет разбор того, как нейросети изображают русских. Т.е. они делают акцент на какие-то старые вещи типа ушанки, либо более новые типа гопников. Что акцентируют идеологически - СССР ли, попов, военных в масках как на мемах. Изображают ли русских или россиян (например, с азиатскими или "евразийскими" чертами). Акцент делают на людях или на каких-то фоновых вещах типа собора Василия Блаженного. А вместо этого просто про фразы. Эх.

- Мой комментарий к посту с обманчивым названием

Акцент в основном на чертах лица и одежде, а также зданиях и погоде.

Антураж. В исторической одежде акцент на времена поздней Российской империи и раннего СССР. Поздний СССР, летние образы а-ля Олимпиада слабо представлены, за исключением комиксов. При запросах про современность часто показывает людей в униформе типа милиционеров и военных, если не спрашивать про молодежь. Это отличает русских от других восточных европейцев вроде беларусов и молдаван, но роднит их с немцами. В целом самый частый образ - в духе новых кассовых исторических фильмов а-ля про Колчака. В то же время, обильно используются меха и элементы средневекового костюма - возможно, из-за священников.

Фенотип. Что касается черт лица, обычно русских вне нейросетей изображают трех видов:
1) Нордические блондины а-ля Дмитрий Донской или всякие святые отроки;
2) Пухловатые черты лица с чувственными губами и курносым носом картошкой, вроде чуть более темных финнов;
3) Брутальные рабочие с этнически немного "татарскими" чертами и более темной пигментацией, чем в 1 и 2.

В искусстве СССР часто инженеров рисовали в духе 1, крестьян в духе помеси 1 и 2, а рабочих в духе помеси 2 и 3. Занятно, что наиболее по-советски выглядит комикс. По запросу "русские в стиле Warhammer" получается экстремальный вариант 3 (там они выглядят, как узбеки в других запросах), а по запросу вроде "русские в стиле аниме" получается 1. Романтически русские себя любят изображать как 1 или 2 (часто 2 любят, когда контрастируют русских с немцами, англичанами и пр.) и в белой длинной рубашке. Но этот образ редко всплывает у AI.

Впрочем, AI явно не особо следует этим стереотипным канонам. Современная молодежь вообще не особо в них вписывается, но при этом выглядят явно русской. Пожалуй, даже беларусы больше соответствуют старым канонам с широкими скулами. Допустим, последняя панель с молодежью выглядит как кадр из современного сериала. У юношей нет ни особо светлой пигментации, ни круглой головы, однако выглядят они как вполне типичные узнаваемые русские зумеры.

Фон. Новые мемы про гопников и корты еще не пробрались в нейросети. Попы есть, военные есть, но не только. На фоне, впрочем, почти всегда какие-то церкви. Иногда Питер. Очень подчеркивается зима, холод, снег.

Что будет во второй части

Во второй части через несколько дней покажу оставшиеся четыре общих запроса, а также приведу большую выборку русских по случайным запросам с обсуждением. Также скажу немного о других сетях типа DALLE.

331331
163 комментария

Нормально ты заморочилась.

22
Ответить

Люблю основательно подходить к теме этничности. На мой взгляд, она слабо обсуждается в русскоязычном пространстве, а в англоязычном обсуждается много, но сомнительно.

40
Ответить

Нихуя не понятно ворох нагенерированных фоточек. Хотя идея статьи звучит интересно. Из-за отсутствия структуры пустая трата битов

22
Ответить

В смысле? Как раз довольно ясная структура. Одинаковый запрос, заменяется только название народа, повторяется 18 раз для разных народов. Куда еще системнее. Прекрасно видно, чем отличаются армяне от русских, например, или таджики от узбеков - и эти отличия многократно повторяются.

29
Ответить

сорри... короче... с НГ....нстесственно!

3
Ответить

Очень интересная статья, но один вопрос есть. Не троллю, не провоцирую.

Почему во всей статье ни разу не упоминаются украинцы? Особенно было бы интересно на дух нации посмотреть.

Особенно учитывая, что беларусы и молдаване есть

8
Ответить

Как же не упоминаются? Упоминаются.
Украинцы. Украинцев не включаем из соображений политической цензуры в РФ, а то на ДТФ что-то стали часто баннить. Там ведь даже украинский флаг может быть, опасно. Можете сами повводить украинцев с этими запросами, чтобы пост не сносили.

Дух нации там крутой и современный получается, но для ДТФ это слишком.

35
Ответить