Wikidata

Wikidata — открытый многоязычный knowledge graph под управлением Wikimedia Foundation, запущенный 29 октября 2012 года. Содержит более 120 миллионов сущностей с уникальными QID-идентификаторами, лицензия CC0. Используется поисковиками, AI-системами и крупными библиотеками для построения связных данных.

4 минуты чтения

Wikidata — это машиночитаемый аналог Википедии. Вместо текстовых статей в ней хранятся структурированные сущности: каждая страна, компания, человек, продукт, концепция получает уникальный идентификатор (QID) и набор свойств. Эти данные используют поисковики Google и Bing, AI-системы Claude и ChatGPT, библиотеки и государственные сервисы. Для бизнеса Wikidata — главный публичный источник «авторитетных сущностей», на которые сайт может сослаться через свойство sameAs в JSON-LD.

Как это работает

В основе Wikidata — модель элементов и свойств. Каждый элемент имеет уникальный QID (например, Q42 — Дуглас Адамс, Q649 — Москва, Q5 — человек как класс). Каждое свойство имеет PID (например, P31 — instance of, P569 — date of birth). Утверждения собираются в триплеты, которые можно представить через RDF:

Q42 P31 Q5      # Дуглас Адамс — это человек
Q42 P569 "1952-03-11"  # Дата рождения
Q42 P800 Q3107658  # Известная работа: «Автостопом по галактике»

Все эти данные опубликованы под лицензией CC0 (общественное достояние) — их можно свободно использовать в любых проектах, включая коммерческие, без атрибуции.

Запрашивать Wikidata можно через язык SPARQL — публичный endpoint расположен по адресу query.wikidata.org. Это бесплатный инструмент конкурентного и контент-анализа: за 30 секунд можно получить список всех компаний в нише с их размером, локацией и связями.

История проекта

Wikidata запущена 29 октября 2012 года как первый новый проект Wikimedia Foundation с 2006 года. Изначально финансирование составило €1.3 млн от Allen Institute for AI, Gordon and Betty Moore Foundation и Google. Разработку вела немецкая Wikimedia Deutschland под руководством Лидии Пинчер.

Ключевая дата для бизнеса — декабрь 2014 года, когда Google объявил о закрытии Freebase в пользу Wikidata. С этого момента Wikidata стала главным открытым источником сущностей для Google Knowledge Graph. По состоянию на апрель 2026 года в Wikidata более 120 миллионов сущностей, более 2,4 миллиарда правок, около 42 тысяч активных редакторов.

Зачем она бизнесу

Wikidata решает четыре практические задачи для бренда.

1. Связывание сущностей через sameAs. Если у бренда, основателя или продукта есть страница в Wikidata, на сайте можно указать в JSON-LD: "sameAs": ["https://www.wikidata.org/wiki/Q..."]. Это говорит поисковикам и AI-системам: «Эта сущность тождественна вот этой проверенной». Один из самых сильных сигналов для попадания в Google Knowledge Graph и AI-цитирования в Perplexity, Claude, ChatGPT.

2. Knowledge panel в Google. Knowledge Panel — это блок справа в выдаче с информацией о сущности (компании, человеке, бренде). Wikidata — один из главных источников данных для этого блока. Создание правильно оформленной страницы в Wikidata повышает шансы на собственный Knowledge Panel.

3. Цитируемость в AI-системах. Все крупные LLM (ChatGPT, Claude, Gemini) обучались на данных Wikidata. Если у бренда нет страницы в Wikidata, AI могут «не знать» о нём и не упоминать в ответах. Если страница есть — точность цитирования резко возрастает, потому что AI получает структурированные факты, а не догадки из обрывков веб-страниц.

4. Конкурентный и нишевый анализ через SPARQL. Бесплатный инструмент сбора данных о конкурентах, рынке, географии. За минуты можно получить то, что обычно требует подписки на платные базы данных.

Как попасть в Wikidata

Wikidata следует строгим правилам нотабельности — не любая компания или человек может иметь страницу. Базовые критерии:

  • Сущность должна иметь упоминания в авторитетных независимых источниках (СМИ, академические работы, отраслевые отчёты)
  • Не подходит самостоятельно созданная страница без внешних подтверждений
  • Все утверждения должны иметь reference — ссылку на источник
  • Wikidata — не каталог продуктов, не место для маркетинговых описаний, не база контактов

Для большинства брендов оптимальный путь — не создавать свою страницу с нуля, а дополнить существующую (если она уже создана редакторами Википедии) или подождать, пока появится естественный повод (например, серьёзная пресс-публикация, награда, поглощение).

Пример

В январе 2026 у клиента в нише edtech была страница в Википедии (создана редактором сообщества), но в Wikidata — пустой элемент с одной строкой «компания». Я подключила SPARQL-аналитика, который проверил, какие свойства типичны для качественных страниц компаний-конкурентов в той же нише. Нашли 14 пропущенных свойств: год основания, страна регистрации, индустрия, основатели, headquarters, official website, ISIC-код, ключевые продукты, инвестиционные раунды, награды.

За три недели редактор сообщества (не сам клиент — это важно для соблюдения правил Wikidata) дополнил страницу с reference на пресс-публикации, отчётность СПАРК и новости. Через два месяца у клиента появился Knowledge Panel в Google по бренд-запросу. Цитирования в Perplexity и ChatGPT по нишевым запросам выросли — оба AI стали корректно упоминать год основания и страну компании. Вложение со стороны клиента — около 8 часов работы по сбору пресс-материалов и общению с редактором сообщества.

Вывод: Wikidata — один из самых дешёвых способов системно усилить присутствие бренда в AI-выдаче. Эффект отложенный (2–6 месяцев), но устойчивый: данные из Wikidata попадают в обучающие выборки большинства LLM.

Частые вопросы

Чем Wikidata отличается от Википедии?

Википедия — энциклопедия с текстовыми статьями для людей, у каждого языкового раздела свой контент. Wikidata — машиночитаемая база структурированных данных: каждая сущность имеет уникальный QID и набор свойств. Wikidata одна для всех языков, переводятся только метки и описания. Википедия и Wikidata — связанные проекты Wikimedia Foundation, обе работают на движке MediaWiki.

Как создать страницу в Wikidata для своей компании?

Wikidata следует строгим правилам нотабельности. Самостоятельно созданные страницы без подтверждений в авторитетных независимых источниках обычно удаляются модераторами. Правильный путь: накопить упоминания в СМИ и отраслевых отчётах, попросить опытного редактора сообщества создать или дополнить страницу с reference. Создавать страницу самому без ссылок на внешние источники не стоит — это нарушает Conflict of Interest policy.

Что такое QID в Wikidata?

QID — уникальный идентификатор сущности в Wikidata, состоящий из буквы Q и числа. Например, Q42 — Дуглас Адамс, Q649 — Москва, Q5 — человек как класс. QID не зависит от языка и не меняется со временем — это позволяет ссылаться на сущность одинаково из любого языкового раздела Википедии и из любых внешних систем. Свойства имеют похожие идентификаторы с буквой P (P31, P569 и так далее).

Можно ли использовать данные Wikidata в коммерческих проектах?

Да, без ограничений. Все данные Wikidata опубликованы под лицензией CC0 — это режим общественного достояния, который не требует атрибуции, разрешает любое использование, включая коммерческое, и не накладывает обязательств share-alike. Это самая свободная из существующих свободных лицензий.

Как Wikidata связана с Google Knowledge Graph?

Google использует Wikidata как один из главных открытых источников структурированных данных для Knowledge Graph. После закрытия проекта Freebase в декабре 2014 года Google объявил о переходе на Wikidata в качестве основного источника. Сейчас данные Wikidata активно используются для Knowledge Panels в выдаче, особенно для бизнеса, людей и организаций.

Влияет ли наличие в Wikidata на цитирование в ChatGPT и Perplexity?

Да, существенно. Все крупные LLM обучались на данных Wikidata, поэтому информация о сущностях, имеющих страницу в Wikidata, попадает в параметрические знания модели. Это повышает точность цитирования и снижает риск, что AI «не узнает» бренд. Для AI-систем с веб-поиском (Perplexity, ChatGPT с web browsing) Wikidata также служит верифицированным источником при формировании ответа.

Как сделать SPARQL-запрос к Wikidata?

Открыть query.wikidata.org, ввести запрос в редактор и нажать «Execute». Базовый шаблон: SELECT ?item ?itemLabel WHERE { ?item wdt:P31 wd:Q5 . } LIMIT 10 — этот запрос вернёт 10 любых сущностей-людей. Wikidata Query Service подсказывает синтаксис, генерирует визуализации и сохраняет историю запросов. Для непрограммистов в 2021 году выпущен Query Builder — визуальный конструктор без знания SPARQL.

Материалы по теме

Валентина Меланина

Нужна консультация?

Разберу ваш сайт и покажу точки роста

Если хотите понять, как этот термин применить к вашему проекту — начнём с аудита.