Linked Data — это идея, что данные на разных сайтах должны быть «прошиты» одинаковыми идентификаторами, чтобы машина могла понять: «эта сущность здесь — та же, что и сущность вон там». Концепцию сформулировал Тим Бернерс-Ли (изобретатель веба) в 2006 году в коротком манифесте на собственном сайте W3C. Без Linked Data веб остаётся бесконечным набором независимых текстов; с Linked Data — превращается в единый связный граф знаний, который понимают и поисковики, и AI-системы.
Как это работает
Тим Бернерс-Ли сформулировал четыре принципа Linked Data:
- Использовать URI как имена. Каждая сущность (человек, организация, концепт) должна иметь уникальный URI
- Использовать HTTP URI. Чтобы любой мог ввести URI в браузер и получить о сущности больше информации
- Возвращать полезные данные при обращении к URI. В стандартизированных форматах: RDF, JSON-LD, Turtle
- Включать ссылки на другие URI. Чтобы пользователь (человек или машина) мог переходить от одной сущности к связанным
На практике это означает: сущность «Москва» на одном сайте идентифицируется тем же URI, что на другом, что в Wikidata, что в Google Knowledge Graph. Машина видит совпадение и связывает данные.
Для оценки качества публикации данных Бернерс-Ли в 2010 году ввёл систему «5 звёзд Open Data»:
| Звёзд | Что значит | Пример |
|---|---|---|
| ★ | Данные доступны в интернете под открытой лицензией | PDF-документ |
| ★★ | Данные структурированы, машиночитаемы | Excel-файл |
| ★★★ | Структурированы и в открытом формате | CSV |
| ★★★★ | Используют URI для идентификации сущностей | RDF, JSON-LD |
| ★★★★★ | Связаны с другими данными через URI | Wikidata, Schema.org с sameAs |
Linked Open Data (LOD)
Linked Open Data — пересечение двух движений: Open Data (открытые данные с открытой лицензией) и Linked Data (связанные через URI). Главные публичные источники LOD — Wikidata, DBpedia, GeoNames, MusicBrainz, государственные открытые данные ЕС и США. Все они связаны между собой через общие URI и образуют так называемый «LOD Cloud» — глобальный граф открытых данных размером в миллиарды триплетов.
Зачем это нужно
Для маркетолога и владельца сайта Linked Data решает две задачи.
1. Сильная связность сущностей бренда с проверенными графами. Через свойство sameAs в Schema.org сайт говорит поисковикам и AI: «наша сущность Person с автором — это тот же человек, что в Wikidata Q123, что в LinkedIn, что в ORCID». Это резко повышает доверие AI-систем к контенту: они получают подтверждение из независимых источников. Один из ключевых факторов попадания в Google Knowledge Panel и в AI-цитирования.
2. Структурированные данные, готовые к использованию AI. AI-системы парсят Linked Data на порядок лучше, чем неструктурированный HTML. Ответ Perplexity или Claude на запрос о компании, имеющей качественную Linked Data разметку, будет точнее и содержательнее, чем о компании с обычной маркетинговой страницей.
Для бизнеса Wikidata — самый дешёвый вход в Linked Data: страница в Wikidata автоматически становится частью LOD Cloud и распространяется через все системы, которые её используют.
Пример
В одном проекте B2B SaaS-клиента мы провели аудит «глубины» Linked Data на сайте. Изначально на каждой странице блога был JSON-LD типа Article и Person, но без связей с внешними графами. Внешний эксперт назывался по имени, без указания, кто это и где его искать.
Доработка заняла месяц: для каждого автора добавили sameAs с тремя-пятью авторитетными ссылками (Wikidata Q-страница, LinkedIn, профиль в Pubmed для медицинского эксперта, страница автора в отраслевом издании). Для самого продукта компании добавили sameAs на Crunchbase, ProductHunt, страницу в Wikidata. Через два месяца Perplexity начал упоминать конкретных авторов компании в ответах на нишевые запросы — раньше система знала только название бренда без персонификации.
Вывод: Linked Data — не отдельная технология, а культура структурирования данных. Реализуется через JSON-LD, Schema.org и связи с Wikidata, и в 2026 году это один из самых сильных бесплатных инструментов AI-видимости.