Linked Data

Linked Data (связанные данные) — концепция публикации структурированных данных в вебе так, чтобы их можно было соединять между сайтами через общие идентификаторы (URI). Принципы предложил Тим Бернерс-Ли в 2006 году. Технологическая основа — RDF, SPARQL, Wikidata, schema.org.

3 минуты чтения

Linked Data — это идея, что данные на разных сайтах должны быть «прошиты» одинаковыми идентификаторами, чтобы машина могла понять: «эта сущность здесь — та же, что и сущность вон там». Концепцию сформулировал Тим Бернерс-Ли (изобретатель веба) в 2006 году в коротком манифесте на собственном сайте W3C. Без Linked Data веб остаётся бесконечным набором независимых текстов; с Linked Data — превращается в единый связный граф знаний, который понимают и поисковики, и AI-системы.

Как это работает

Тим Бернерс-Ли сформулировал четыре принципа Linked Data:

  1. Использовать URI как имена. Каждая сущность (человек, организация, концепт) должна иметь уникальный URI
  2. Использовать HTTP URI. Чтобы любой мог ввести URI в браузер и получить о сущности больше информации
  3. Возвращать полезные данные при обращении к URI. В стандартизированных форматах: RDF, JSON-LD, Turtle
  4. Включать ссылки на другие URI. Чтобы пользователь (человек или машина) мог переходить от одной сущности к связанным

На практике это означает: сущность «Москва» на одном сайте идентифицируется тем же URI, что на другом, что в Wikidata, что в Google Knowledge Graph. Машина видит совпадение и связывает данные.

Для оценки качества публикации данных Бернерс-Ли в 2010 году ввёл систему «5 звёзд Open Data»:

ЗвёздЧто значитПример
Данные доступны в интернете под открытой лицензиейPDF-документ
★★Данные структурированы, машиночитаемыExcel-файл
★★★Структурированы и в открытом форматеCSV
★★★★Используют URI для идентификации сущностейRDF, JSON-LD
★★★★★Связаны с другими данными через URIWikidata, Schema.org с sameAs

Linked Open Data (LOD)

Linked Open Data — пересечение двух движений: Open Data (открытые данные с открытой лицензией) и Linked Data (связанные через URI). Главные публичные источники LOD — Wikidata, DBpedia, GeoNames, MusicBrainz, государственные открытые данные ЕС и США. Все они связаны между собой через общие URI и образуют так называемый «LOD Cloud» — глобальный граф открытых данных размером в миллиарды триплетов.

Зачем это нужно

Для маркетолога и владельца сайта Linked Data решает две задачи.

1. Сильная связность сущностей бренда с проверенными графами. Через свойство sameAs в Schema.org сайт говорит поисковикам и AI: «наша сущность Person с автором — это тот же человек, что в Wikidata Q123, что в LinkedIn, что в ORCID». Это резко повышает доверие AI-систем к контенту: они получают подтверждение из независимых источников. Один из ключевых факторов попадания в Google Knowledge Panel и в AI-цитирования.

2. Структурированные данные, готовые к использованию AI. AI-системы парсят Linked Data на порядок лучше, чем неструктурированный HTML. Ответ Perplexity или Claude на запрос о компании, имеющей качественную Linked Data разметку, будет точнее и содержательнее, чем о компании с обычной маркетинговой страницей.

Для бизнеса Wikidata — самый дешёвый вход в Linked Data: страница в Wikidata автоматически становится частью LOD Cloud и распространяется через все системы, которые её используют.

Пример

В одном проекте B2B SaaS-клиента мы провели аудит «глубины» Linked Data на сайте. Изначально на каждой странице блога был JSON-LD типа Article и Person, но без связей с внешними графами. Внешний эксперт назывался по имени, без указания, кто это и где его искать.

Доработка заняла месяц: для каждого автора добавили sameAs с тремя-пятью авторитетными ссылками (Wikidata Q-страница, LinkedIn, профиль в Pubmed для медицинского эксперта, страница автора в отраслевом издании). Для самого продукта компании добавили sameAs на Crunchbase, ProductHunt, страницу в Wikidata. Через два месяца Perplexity начал упоминать конкретных авторов компании в ответах на нишевые запросы — раньше система знала только название бренда без персонификации.

Вывод: Linked Data — не отдельная технология, а культура структурирования данных. Реализуется через JSON-LD, Schema.org и связи с Wikidata, и в 2026 году это один из самых сильных бесплатных инструментов AI-видимости.

Частые вопросы

Кто и когда придумал Linked Data?

Концепцию сформулировал Тим Бернерс-Ли — изобретатель Всемирной паутины — в 2006 году в коротком манифесте на сайте W3C. В 2010 году он дополнил концепцию пятизвёздочной шкалой качества Open Data. Бернерс-Ли регулярно подчёркивает, что Linked Data — естественное продолжение его исходной идеи семантического веба.

Какие четыре принципа Linked Data?

1) Использовать URI как имена для сущностей. 2) Использовать HTTP URI, чтобы любой мог получить информацию о сущности через браузер. 3) Возвращать полезные данные в стандартизированных форматах (RDF, JSON-LD, Turtle). 4) Включать ссылки на другие URI, чтобы создавать связный граф. Эти принципы Бернерс-Ли сформулировал в 2006 году.

Что такое 5 звёзд Open Data?

Шкала качества публикации данных от Бернерса-Ли (2010): 1 звезда — данные в интернете под открытой лицензией. 2 — структурированы и машиночитаемы. 3 — в открытом формате. 4 — используют URI для идентификации сущностей. 5 — связаны с другими данными через URI. Цель — стимулировать переход от закрытых форматов к открытым связанным данным.

Чем Linked Data отличается от Open Data?

Open Data — данные, опубликованные под открытой лицензией для свободного использования. Linked Data — данные, связанные между собой через общие URI. Это пересекающиеся, но не тождественные концепции. Linked Open Data (LOD) — данные одновременно открытые и связанные. Это и есть высший уровень — пятизвёздочные данные по шкале Бернерса-Ли.

Как Linked Data связана с RDF и Schema.org?

RDF — основная модель данных для Linked Data: триплеты subject-predicate-object с URI вместо обычных текстовых имён. Schema.org — словарь типов и свойств, используемых при разметке. JSON-LD — формат записи Linked Data, рекомендованный Google. Все эти технологии работают вместе: Schema.org даёт словарь, RDF — модель, JSON-LD — синтаксис записи.

Что такое LOD Cloud?

LOD Cloud (Linked Open Data Cloud) — визуализация всех публичных датасетов, опубликованных в виде Linked Open Data и связанных между собой через URI. Включает Wikidata, DBpedia, GeoNames, MusicBrainz, государственные открытые данные ЕС, США, Великобритании, академические репозитории. По состоянию на 2024 год — несколько тысяч датасетов с миллиардами триплетов.

Как использовать Linked Data на обычном сайте?

Самый простой путь — добавить в JSON-LD разметку Schema.org свойство sameAs со ссылками на Wikidata, LinkedIn, профили в авторитетных источниках. Это превращает сущности на сайте (автор, компания, продукт) в часть LOD Cloud. Не требует развёртывания SPARQL endpoint или сложной инфраструктуры — достаточно добавить ссылки в существующую разметку.

Материалы по теме

Валентина Меланина

Нужна консультация?

Разберу ваш сайт и покажу точки роста

Если хотите понять, как этот термин применить к вашему проекту — начнём с аудита.