Wikidata — это машиночитаемый аналог Википедии. Вместо текстовых статей в ней хранятся структурированные сущности: каждая страна, компания, человек, продукт, концепция получает уникальный идентификатор (QID) и набор свойств. Эти данные используют поисковики Google и Bing, AI-системы Claude и ChatGPT, библиотеки и государственные сервисы. Для бизнеса Wikidata — главный публичный источник «авторитетных сущностей», на которые сайт может сослаться через свойство sameAs в JSON-LD.
Как это работает
В основе Wikidata — модель элементов и свойств. Каждый элемент имеет уникальный QID (например, Q42 — Дуглас Адамс, Q649 — Москва, Q5 — человек как класс). Каждое свойство имеет PID (например, P31 — instance of, P569 — date of birth). Утверждения собираются в триплеты, которые можно представить через RDF:
Q42 P31 Q5 # Дуглас Адамс — это человек
Q42 P569 "1952-03-11" # Дата рождения
Q42 P800 Q3107658 # Известная работа: «Автостопом по галактике»
Все эти данные опубликованы под лицензией CC0 (общественное достояние) — их можно свободно использовать в любых проектах, включая коммерческие, без атрибуции.
Запрашивать Wikidata можно через язык SPARQL — публичный endpoint расположен по адресу query.wikidata.org. Это бесплатный инструмент конкурентного и контент-анализа: за 30 секунд можно получить список всех компаний в нише с их размером, локацией и связями.
История проекта
Wikidata запущена 29 октября 2012 года как первый новый проект Wikimedia Foundation с 2006 года. Изначально финансирование составило €1.3 млн от Allen Institute for AI, Gordon and Betty Moore Foundation и Google. Разработку вела немецкая Wikimedia Deutschland под руководством Лидии Пинчер.
Ключевая дата для бизнеса — декабрь 2014 года, когда Google объявил о закрытии Freebase в пользу Wikidata. С этого момента Wikidata стала главным открытым источником сущностей для Google Knowledge Graph. По состоянию на апрель 2026 года в Wikidata более 120 миллионов сущностей, более 2,4 миллиарда правок, около 42 тысяч активных редакторов.
Зачем она бизнесу
Wikidata решает четыре практические задачи для бренда.
1. Связывание сущностей через sameAs. Если у бренда, основателя или продукта есть страница в Wikidata, на сайте можно указать в JSON-LD: "sameAs": ["https://www.wikidata.org/wiki/Q..."]. Это говорит поисковикам и AI-системам: «Эта сущность тождественна вот этой проверенной». Один из самых сильных сигналов для попадания в Google Knowledge Graph и AI-цитирования в Perplexity, Claude, ChatGPT.
2. Knowledge panel в Google. Knowledge Panel — это блок справа в выдаче с информацией о сущности (компании, человеке, бренде). Wikidata — один из главных источников данных для этого блока. Создание правильно оформленной страницы в Wikidata повышает шансы на собственный Knowledge Panel.
3. Цитируемость в AI-системах. Все крупные LLM (ChatGPT, Claude, Gemini) обучались на данных Wikidata. Если у бренда нет страницы в Wikidata, AI могут «не знать» о нём и не упоминать в ответах. Если страница есть — точность цитирования резко возрастает, потому что AI получает структурированные факты, а не догадки из обрывков веб-страниц.
4. Конкурентный и нишевый анализ через SPARQL. Бесплатный инструмент сбора данных о конкурентах, рынке, географии. За минуты можно получить то, что обычно требует подписки на платные базы данных.
Как попасть в Wikidata
Wikidata следует строгим правилам нотабельности — не любая компания или человек может иметь страницу. Базовые критерии:
- Сущность должна иметь упоминания в авторитетных независимых источниках (СМИ, академические работы, отраслевые отчёты)
- Не подходит самостоятельно созданная страница без внешних подтверждений
- Все утверждения должны иметь reference — ссылку на источник
- Wikidata — не каталог продуктов, не место для маркетинговых описаний, не база контактов
Для большинства брендов оптимальный путь — не создавать свою страницу с нуля, а дополнить существующую (если она уже создана редакторами Википедии) или подождать, пока появится естественный повод (например, серьёзная пресс-публикация, награда, поглощение).
Пример
В январе 2026 у клиента в нише edtech была страница в Википедии (создана редактором сообщества), но в Wikidata — пустой элемент с одной строкой «компания». Я подключила SPARQL-аналитика, который проверил, какие свойства типичны для качественных страниц компаний-конкурентов в той же нише. Нашли 14 пропущенных свойств: год основания, страна регистрации, индустрия, основатели, headquarters, official website, ISIC-код, ключевые продукты, инвестиционные раунды, награды.
За три недели редактор сообщества (не сам клиент — это важно для соблюдения правил Wikidata) дополнил страницу с reference на пресс-публикации, отчётность СПАРК и новости. Через два месяца у клиента появился Knowledge Panel в Google по бренд-запросу. Цитирования в Perplexity и ChatGPT по нишевым запросам выросли — оба AI стали корректно упоминать год основания и страну компании. Вложение со стороны клиента — около 8 часов работы по сбору пресс-материалов и общению с редактором сообщества.
Вывод: Wikidata — один из самых дешёвых способов системно усилить присутствие бренда в AI-выдаче. Эффект отложенный (2–6 месяцев), но устойчивый: данные из Wikidata попадают в обучающие выборки большинства LLM.