Freebase: В каком файле дампа данных содержится "imdb_id"?

Я запускаю IMDbAPI.com и использую Bing Search API для поиска идентификатора IMDb из поиска по типу. Bing в настоящее время меняет свой API на Azure Marketplace (1 августа) и больше не доступен бесплатно. Я начал тестировать свой API с помощью Freebase, чтобы разрешить эти идентификаторы и достигнуть своего 100-кратного лимита за первые 8 часов (на моем сайте в настоящее время поступает около 3 миллионов запросов в день, но только 200-300 тыс. - поиск по ключевым словам)

Именно поэтому они предлагают файлы дампов данных,

Я загрузил большинство файлов в папке "Фильм", но не могу найти, где они хранят данные пространства имен iddb id//imdb/title.

https://www.googleapis.com/freebase/v1/mqlread?query= { "type" : "/film/film" , "name" : "Верно %20Grit" , "imdb_id" : NULL, "initial_release_date > =" : "1969-01" , "предел" : 1}

Вот как я сейчас обращаюсь к ID.

Кто-нибудь знает, какой файл содержит эту информацию? и как связать его с названием фильма/id?

Ответ 1

Это свойство imdb_id поддерживается ключом в пространстве имен /authority/imdb/title, поэтому вы ищете строку:

/m/015gxt       /type/object/key        /authority/imdb/title   tt0065126

в файле http://download.freebase.com/datadumps/latest/freebase-datadump-quadruples.tsv.bz2

Это файл размером 4 ГБ, поэтому будьте готовы немного подождать загрузки. Обратите внимание, что все связано с MID, поэтому сначала вам нужно понять это, если у вас его нет в вашей базе данных.

Эквивалентный запрос с использованием MQL вместо дампов данных https://www.googleapis.com/freebase/v1/mqlread?query=%7B% 22type% 22% 22% 3a/пленка/пленка 22%,% 22name% 22% 3a% 22True %20Grit% 22% 22imdb_id% 22% 3anull,% 22initial_release_date% 3E =% 22% 3a% 221969-01% 22, % 22mid% 22: null,% 22key% 22: [{% 22namespace% 22:% 22/authority/imdb/title% 22}],% 22limit% 22: 1% 7D & indent = 1

EDIT: p.s. Я уверен, что файлы в каталоге "Обзор" уходят, поэтому я не буду зависеть от них, даже если вы найдете там информацию.

Ответ 2

Предыдущий ответ работает отлично, просто, что более быстрая версия такого запроса может быть:

query = [{
          'type': '/film/film',
          'name': 'prometheus',
          'imdb_id': null,
          ...
        }];

Остальная часть запроса MQL не упоминается, поскольку она не отличается от упомянутого выше. Надеюсь, что это поможет.