Какова связь между RDF, RDFa, Microformats и Microdata

Я провел довольно много исследований, но я не могу понять точные отношения между ними. Кроме того, теперь, когда W3C официально признал RDFa, вы бы порекомендовали его над Microdata, учитывая, что он соответствует функциям Microdata и более?

Ответ 1

<sarcasm> Я не могу представить, что вы находите настолько запутанным </sarcasm> (изменить: эти теги были невидимыми раньше)

Очень кратко:

  • Микроформаты Способ использования html-страниц как для считываемого человеком документа, так и для машиносчитываемых данных без повторения (например, приклеивание CSV в элементе head).
  • RDF Модель данных, предназначенная для Интернета. Schemaless, использует URL-адреса для обозначения типов и отношений.
  • RDFa Способ кодирования (записи) RDF в html, следуя стилю микроформатов (т.е. минимизации повторения). Работает, добавив несколько атрибутов в html.
  • Микроданные Альтернатива RDFa, использующая разные атрибуты и другую модель данных.

Менее кратко, RDF возник из попыток сделать данные "webby". Был даже плагин для просмотра RDF-предшественника MCF (от Apple, с любопытством). Модель данных была спроектирована так, чтобы вы могли писать то, что хотите, без предварительной настройки имен столбцов или ключевых значений со всеми остальными в Интернете. RDF был стандартно написан (сериализован) с использованием XML (хотя доступны и другие, более приятные форматы).

Таким образом, в этом мире у вас может быть читаемая домашняя страница (me.html) и домашняя страница данных (me.rdf) для машин, которые нужно зачерпнуть. Эти машины не поймут значение <p>I live in <a href="http://example.com/Chicago">Chicago</a></p>, но они могут использовать :me ex:livesIn <http://example.com/Chicago>, если они ищут "livesIn".

Микроформаты также пытаются сделать данные "webby", или, возможно, это должен быть веб-данные-y. Проницательность здесь заключается в том, что на веб-страницах есть много данных, между прозой. Если у вас есть несколько советов, машина может решить, что этот фрагмент html выше в основном является адресом. Этими подсказками являются микроформаты. Обычно они используют соглашения вокруг имен класса html, чтобы указать, что содержимое больше, чем текст.

Таким образом, для микроформатов не требуется отдельная веб-страница для машин. Но микроформаты охватывают только несколько типов данных (адреса, ссылки друзей, положение...) из-за того, как они работают. Каждая из них является конкретной конвенцией, которая должна быть согласована. Используемые без заботы они тоже могут плохо смешаться.

RDFa - это попытка получить как гибкость RDF, так и простоту микроформатов. Микроданные были ответом на RDFa, но с другой моделью данных (грубо массивы и хеши, а не реляционная модель). В отличие от микроформатов ни диктуют, какая информация предоставляется, а как именно она кодируется.

Чтобы завершить то, что у нас отсутствует, теперь у нас есть schema.org, который является инициативой больших поисковых систем (Google, Bing, Yahoo, Yandex) для индексации веб-данных. schema.org координирует эти значения, поэтому поисковая система знает, что, скажем, события имеют местоположения. Первоначально Microdata использовался schema.org, но теперь поддерживаются как микроданные, так и RDFa.

В эти дни я бы игнорировал микроформаты и пошел на schema.org. Мой личный вкус - это кодирование RDFa, но либо оно, либо микроданные должны работать нормально.

Ответ 2

все три являются попытками сделать веб-контент более смысловым.

rdfa столкнулась со многими препятствиями для входа; он поделился той же растущей болью, что xml (rdfa на основе xml) сделал в первые годы работы в Интернете, но, вероятно, более значителен, потому что было меньше разработчиков, обработанных.

Я не знаю достаточно о rdfa, чтобы рекомендовать его по микроданным. я склонен к микроданным, потому что Google, Yahoo!, и Microsoft (теперь Bing) собрались вместе и создали его. В настоящее время разрабатывается rdfa и делается предложение по микроформатам. кроме того, микроформаты уже были в массовом производстве и потреблении в Интернете. поэтому крупные 3 решили сговориться и придумали микроданные. я немного измучен, я думаю, потому что я не принципиально понимаю, почему микроформаты были отброшены. звучит как куча дыма и зеркал.

поэтому я рекомендую микроформаты для всех. они просто просты. и так потрясающе. что вы можете достичь с помощью микроданных, которые вы не можете с помощью микроформатов?

который сказал.... я бы выбрал microdata через rdfa, потому что они так же легки. и атрибуты данных намного превосходят классы html. на самом деле, может быть, большой бонус? данные-атрибуты? так же, как ваши немного исследований, я уже смотрел долго и упорно рассуждения за микроданные, но все, что я могу найти нормальное, шаблонные сообщения.

Ответ 3

Я предлагаю вообще игнорировать семантическую сеть. Из-за этого поисковые системы не отправят вам больше посетителей. Вместо этого они будут использовать идеально организованные данные, чтобы предоставить ответ, не отправив вам посетителей вообще.

Сегодня вы можете увидеть проблему со следующим примером фильма: https://www.google.com/search?q=The+Godfather

Отображаются рейтинги IMDb и Rotten Tomatoes. Фрагмент Википедии. Приятно для пользователей, плохо для этих сайтов. Или как часто вы посещали IMDb в прошлом и сегодня?

И не забывайте. Отображаемые данные не из IMDb или Rotten Tomatoes. Даты, режиссер, награды, музыка, изображения и т.д. Были собраны с других сайтов. Например, поисковая система может легко искать в своей базе данных "Крестный отец" + "Директор", и если 99 из 100 сайтов включают имя "Фрэнсис Форд Коппола", его легко проверить ответ без какого-либо ручного взаимодействия.

Наконец, поисковые системы могут создавать собственный контент без уплаты или упоминания авторов. И с семантической классификацией вам будет легче.