Микроданные, RDFa или JSON-LD Соответствующее или лучшее использование?

Мне интересно, какой из этих форматов "лучший"? Schema.org, Microdata и RDFa немного больны для реализации. Они могут нарушить валидацию и потребовать довольно много усилий для внесения документов.

JSON-LD, наконец, для меня, способ лучше реализовать структурированные данные. Но работает ли это? Какой уровень поддержки для него (по крайней мере, у Google)?

Ответ 1

Schema.org - это словарь, который может, как и любой другой словарь, использоваться во многих формах. На веб-сайте http://schema.org/ есть примеры с использованием Microdata​​strong > , а синтаксисы RDF RDFa и JSON-LD, но это не единственные синтаксисы, с которыми он может быть использован. Например, вы можете использовать его с любым другим синтаксисом RDF, например Turtle или RDF/XML.

Нет лучшего синтаксиса. Все они имеют преимущества и недостатки. См. Например, мой ответ о различиях между Microdata и RDFa. Обратите внимание, что вы можете использовать разные синтаксисы (и словари) в том же документе.

Теперь, если у вас есть конкретный потребитель, вы должны проконсультироваться со своей документацией. Однако поддержка синтаксисов приходит и уходит, и не все, что они могут поддерживать, обязательно документируется, и не все, что документировано, обязательно работает.

В случае Google вы, вероятно, заинтересованы в их богатых фрагментах. Их документация о богатых фрагментах упоминает Microdata, Microformats и RDFa. Однако обратите внимание, что не все связанные примеры используют словарь Schema.org, но более старые Data-vocabulary.org или Microformats (поскольку вы не можете использовать словари, такие как Schema.org или Data-vocabulary.org с микроформатами). Кроме того, есть несколько Rich Snippets, которые присутствуют на этой странице, например "Поисковый ящик ссылок" , для которых они даже рекомендуют синтаксис JSON-LD.

Как общий совет: поисковые системы обычно предпочитают видимое содержимое по скрытым метаданным. Например, наличие ключевых слов в виде скрытых метаданных позволяет авторам утверждать, что их документы касаются чего-то другого, чем они есть на самом деле (либо из-за попытки обмануть поисковую систему, либо потому, что авторы забывают обновлять контент в обоих местах). Следовательно, расцепление метаданных из контента, как и его случай с JSON-LD, может (возможно!) Привести к тем же проблемам, что и текущие поисковые системы со скрытыми метаданными. (Если или какие поисковые системы фактически обрабатывают его, это вопрос, который не соответствует теме.)

Другим возможным преимуществом для соединения метаданных с контентом (например, с RDFa) является то, что вы можете легко и автоматически генерировать ту же информацию в JSON-LD, Turtle и т.д., потому что все просто RDF. Просто проанализируйте RDFa, конвертируйте в форматы ваших предпочтений и вставьте (в script) или ссылку (с rel - alternate), если это имеет смысл.

Но да, добавление RDFa часто сложнее, чем добавление BLOB JSON-LD, потому что вам нужно адаптировать его к существующей разметке. (Тем не менее, он не должен "прерывать проверку", если вы не совершаете ошибок.)

Ответ 2

Линии между Микроданные, RDFa и JSON-LD действительно в настоящее время очень размыты и что до сих пор не принято общепризнанного де-факто среди трех. Это придется ждать сейчас. Возможно, пару или несколько лет.

Между тем, Microdata не должен быть помечен Schema.org, как вы упомянули, потому что эти два - разные вещи. Schema.org - это словарь, поэтому его можно использовать для Microdata, RDFa и JSON-LD.

Использование Schema.org в качестве словаря и использование JSON-LD, поскольку представление данных, вероятно, является самой ожидаемой парой из-за двух общих аспектов:

  • Легко читается для людей; и
  • Легкий машиносчитываемый

но даже при этом все еще есть разъединения между ними, например этот пример.

Что касается поддержки JSON-LD, так как Bing, Google, Yahoo!, и Яндекс подтверждает использование schema.org, возможно, это можно с уверенностью сказать, что они также поддерживают его, как в в этом примере.

Обновление 2017

Google был очень активен в продвижении JSON -LD-schema.org за последние пару или три года.

Ответ 3

Кажется, Google склоняется к использованию JSON-LD, но он не реализовал его для каждого случая использования!

Google в процессе добавления поддержки JSON-LD больше функции с разметкой. Пока что JSON-LD поддерживается для всех Знания Графические функции, дополнительные поля поиска, Event Rich Snippets, и рецепты Rich Snippets; Google рекомендует использовать JSON-LD для эти особенности. Для оставшихся типов Rich Snippets и панировочных сухарей, Google рекомендует использовать микроданные или RDFa.

http://developers.google.com/structured-data/schema-org

Ответ 4

Google использует JSON-LD в качестве ссылочных примеров для структурированных данных SEO для своего графика знаний (компании и люди). См. https://developers.google.com/structured-data/customize/overview

Я лично использую комбинацию JSON-LD и Microdata для моих сайтов (пока).

Я бы сказал, что у них есть другие способы определить, соответствует ли информация, которую вы предоставляете через JSON-LD, их поисковой системе (например, проверка вашей страницы на самом деле говорит о том, о чем она говорит).

Ответ 5

(обновление ответов!)

О "популярности", см. этот вопрос/ответы.

Microdata сегодня является самой популярной: во вселенной из 34 миллионов доменов 5,63 миллиона (~ 17%) используют "разметку контента" (я буду использовать ярлык разметки) с помощью RDFa (0, 9 миллионов), Microdata (2,5 миллиона) или Microformats, и менее половины используют разделенные семантические дескрипторы, замечая наиболее популярные как JSON-LD, с 2,12 миллиона (6 %).
PS: мы предпочитаем" статистику по каждому домену" (вместо статистики по каждой странице), потому что страницы в одном домене в целом имеют одинаковые шаблоны и другие принудительные соглашения с местными органами власти.

В юниверсе "областей, выражающих семантику" (7,75 млн.) статистический профиль:

  • 73% разметки семантический
  • 27% разделенных семантических
  • (... пересечение как "разделенная + разметка" в миксе может быть нулевой, чтобы упростить...)

эмпирическое правило в 2017 году

Используйте семантику разметки с помощью Microdata​​strong > и после нее, если вам нужно что-то больше выражать машинам, использовать JSON-LD.


Использовать семантику разметки, потому что она является самой популярной, и потому что помеченные контент будут проверяться/проверяться одновременно людьми и машинами.

Важно: помните, что Microdata, RDFa (стандарт W3C) и JSON-LD (стандарт W3C) могут быть (легко) переведены в RDF, поэтому все эти форматы совместимы.


PS: для таблиц HTML см. также табличные метаданные W3C. Для открытых ресурсов, отличных от HTML, в качестве файлов CSV используйте RDF-совместимую табличную модель данных W3C и/или frictionlessdata/specs.