Головокружительная проблема цитогенеза в интернете

Published on

«Круговое копирование» информации является серьёзной проблемой для таких платформ, как Википедия — и решить её сложнее, чем кажется.


Перевод статьи Стивена Гаррисона (Stephen Harrison) “The Internet’s Dizzying Citogenesis Problem”, вышедшей 7 мая 2019 г. в американском онлайн-журнале Slate.


Две недели назад доктор Джеймс Хейлман обнаружил нечто странное. Канадский врач скорой помощи и заядлый редактор Википедии заметил, что база данных лекарственных веществ DrugBank копирует текст непосредственно из Википедии. И хоть Хейлман считает, что медицинские статьи Википедии отличаются удивительно хорошим качеством, он был обеспокоен. Потому что он обнаружил, что не только DrugBank копирует и цитирует Википедию, он также увидел несколько примеров, когда Википедия аналогичным образом копировала и ссылалась на DrugBank.

Например, на странице DrugBank описание протамина сульфата, часто используемого в хирургии сердца, включало данные об этом препарате, взятые из статьи о нём в Википедии. В свою очередь, статья Википедии цитировала страницу DrugBank. Подобное круговое копирование создало затруднения для подтверждения достоверности текста Википедии — откуда на самом деле взялась информация? Можно ли ей доверять? Хейлман нашёл пять других статей о лекарствах с аналогичными цикличными отсылками и предположил, что их может быть гораздо больше. Доктор связался с DrugBank, и они стали пытаться решить проблему. Хейлман (известный в Википедии под ником Doc James) высказал свою обеспокоенность на странице обсуждения вики-проекта «Медицина» (WikiProject Medicine) — форума, где редакторы Википедии обсуждают статьи о медицине и здоровье. Он предположил, что «цитогенез стал реальностью».

Термин «цитогенез» был впервые применён для описания подобных «круговых отсылок» в 2011 году Рэнделом Манро — автором популярной серии комиксов-карикатур Xkcd. В одной из своих работ он изображает цитогенез как 4-шаговый процесс:

Источник: https://xkcd.com/978/

Математики и фанаты Эштона Кутчера могли бы описать проблему как «эффект бабочки» в сфере «цифровых знаний».

Сложно определить распространённость подобных случаев «цитогенеза» с задействованием Википедии, так как платформа не требует ссылок на источник при вводе новых данных. Поэтому не существует систематического способа вычислить каждое двустороннее заимствование. По факту многие такие случаи неожиданно обнаруживаются самими пользователями — когда они внезапно натыкаются на записи, от которых у них лезут глаза на лоб. Например, существует серия учебных пособий, в значительной степени опирающаяся на контент Википедии, — и позднее она сама была использована как источник для Википедии. Стоит также вспомнить розыгрыш про несуществующего австралийского туземного бога Jar’Edo Wens. Страница Википедии о нём не была подтверждена источниками, а имя божества подозрительно созвучно с «Джаред Оуэнс». Единственным, кроме этого, вкладом с IP-адреса автора статьи являлась запись о другом фальшивом австралийском боге «Йормуме». Тем не менее, когда почти через десять лет обман с Jar’Edo Wens раскрылся, его имя успело попасть во множество книг. Далеко не всякий инцидент такого рода обнаруживается, по крайней мере сразу.

Самыми постыдными случаями цитогенеза являются те, что привели к массовому распространению дезинформации в СМИ. Список подобных подтверждённых инцидентов включает как вычурные, так и весьма существенные: от шутки про изобретателя плавательного стиля баттерфляй, которую процитировали в The Guardian, до серьёзных биографических расхождений. В декабре 2016 года анонимный пользователь дописал в Википедию, что госсекретарь Майк Помпео участвовал в войне в Персидском заливе. Ложное утверждение повторили такие крупные издания, как Wall Street Journal и New Yorker. И продолжали повторять до тех пор, пока в апреле 2018 года ЦРУ не подтвердило, что Помпео на самом деле не участвовал в военных действиях в заливе.

Разумеется, когда репортёр пишет статью, основанную на неточных данных из Википедии, он несёт ответственность за ошибки. Полагаться на Википедию как на независимый источник — это просто плохая журналистская работа. Онлайн-энциклопедия прямо заявляет, что не гарантирует достоверность информации, содержащейся на редактируемом добровольцами сайте. Его материалы также не подлежат формальному процессу рецензирования. Но на практике миллионы интернет-пользователей (а не только журналисты) полагаются на информацию Википедии. И поскольку некоммерческий фонд Викимедиа заявляет, что стремится превратить свои проекты в ценную инфраструктуру бесплатных и заслуживающих доверия знаний, стоит как минимум рассмотреть меры, снижающие риск распространения непроверенных сведений посредством кругового цитирования.

Но, как я понял из переписки с википедистом Лайамом Уайеттом, написавшим о том, как историки могут использовать Википедию для изучения общественных процессов, решить проблему цитогенеза не так-то просто.

Как у многих википедистов, у Уайетта есть любимый пример этого феномена: инцидент с «ванной Сталина». Он наглядно демонстрирует, насколько проблематичной может стать ситуация. В феврале 2009 года анонимный редактор изменил статью об известном берлинском бульваре Карл-Маркс-аллее в немецкой Википедии. Он указал, что территория была известна как «ванная Сталина» из-за плиточного декора зданий, напоминающих ванные и туалетные комнаты. Эту информацию перепечатали во множестве публикаций. Испытывая вину, автор попытался удалить несуразность, однако другие википедисты отменяли его правку — на тот момент тему уже подтверждали «авторитетные источники». Виновник инцидента решил раскрыть свою шутку, написав разоблачающий материал в газету, где работал журналистом. Благодаря этому он смог создать «источник» чтобы наконец исправить статью.

Уайетт объяснил, что, помимо небрежности журналистов, основная проблема такого цитогенеза — возможность добавлять в Википедию информацию без обязательного требования источника к абсолютно каждому утверждению. Правила написаны так, что весь контент энциклопедии должен быть проверяемым, но нет требований к тому, чтобы он при добавлении проверялся. Это отражает склонность википедистов к тому, что они называют «когда-нибуддизм» — ориентацию на долгосрочную перспективу, а не на немедленную эффективность. Этос принимает недоработанные статьи в надежде, что в дальнейшем они будут качественно улучшены, а не удалены.

Но подтверждение источниками каждого факта совсем не обязательно станет практичным или логичным решением проблемы. Википедия и так содержит ряд важных стандартов в отношении источников. Например, необходимо указывать источники при обновлении биографий ныне живущих людей. Хотя по определённым причинам существуют исключения. По стилистическим соображениям вводная часть статьи обычно не включает ссылки на источники. Она характеризуется бо́льшей обобщённостью, чем последующий подробный текст тела статьи. Википедия также не требует подтверждения бесспорных знаний (т. е. вам не нужно доказывать, что небо голубое). А ещё не рекомендуется излишнее цитирование.

Уайетт объяснил в электронном письме, что, даже не беря в расчёт эти факты, обязательное цитирование для всех видов информации станет проблемой из-за культурных барьеров. Например, он написал, что википедисты активно обсуждают возможность приспособления и включения форм знаний, выходящих за рамки традиционного западного понимания «надёжного источника». Представители сообщества размышляют над возможностью интеграции опыта культур, исторически передающих информацию устно, «таким образом, чтобы это не подорвало нашу основную политику „авторитетных источников“ и запрета „оригинальных исследований“». Решение ещё не найдено, но условие обязательного подтверждения источниками каждого факта статьи почти наверняка станет шагом назад.

С организационной точки зрения контроль обновлений слишком трудоёмок. Я попросил администратора Википедии, известного как TheSandDoctor, или TSD, представить возможное технологическое решение проблемы цитогенеза. Что если специальный фильтр будет запрашивать источник при каждом добавлении данных? TSD пояснил, что это было бы «проблематично по нескольким причинам». Единственный способ реализовать подобный «фильтр» — требовать, чтобы любые изменения или дополнения на странице содержали ссылки. На практике это означает, что незначительные правки, такие как добавление знаков препинания или пробела, потребуют цитат. Это бессмысленно и делает и без того нередко утомительную задачу редактирования Википедии ещё более утомительной.

TSD также указывает, что википедисты не встретят подобную инициативу с распростёртыми объятиями. Особенно те, кто полагает, что Википедии совершенство не требуется. Большинство редакторов предпочли бы единичные случаи «цитогенеза» технологическому контролю, ограничивающему обмен знаниями, пишет TSD.

Существует ли нейтральное решение? Возможно. В немецком и польском разделах Википедии действует механизм «правок, ожидающих подтверждения». Любая информация, добавленная незарегистрированным или новым пользователем, должна быть одобрена опытными участниками. Автору позволяется публиковать свои правки «вживую» только после внесения нескольких сотен правок, одобренных вручную. Предположительно, такая система контроля обновлений может быть выбрана для поддержки пользователей с хорошими навыками поиска источников. Хотя, вероятно, эта система также противоречит концепции энциклопедии, «которую может редактировать каждый». На данный момент в англоязычной Википедии такая технология реализована только для отдельных статей, например, биографий ныне живущих людей, часто подвергающихся вандализму.

Пока обнаружить цикличное заимствование способны только опытные редакторы (например, Хейлман). В этом они могут опираться на свои знания и инстинкты. И, разумеется, читатели должны критически мыслить, взаимодействуя с любой новой информацией, независимо от источника знаний. Это может быть Википедия или другая платформа. Помните, что фикции наподобие «ванны Сталина» могут одновременно казаться и метафорой, и правдой.

More posts by Редакция.
Головокружительная проблема цитогенеза в интернете
Share
Twitter icon Facebook icon