Анализ дампов данных Google Api FreeBase с использованием С#

Я хочу найти бесплатную базу Google Api. Я хочу получить общий объем данных. Например, все идентификаторы песен или фильмов. Я скачал gz-файл дампа данных. Интересно, какое будет лучшее решение для разбора файла и получения нужных мне данных. Я использую .net С#.


person Gidi    schedule 10.05.2013    source источник


Ответы (1)


Есть несколько библиотек .NET, которые могут читать дампы в формате RDF:

Дампы данных также отформатированы как значения, разделенные табуляцией, поэтому вы сможете использовать любой синтаксический анализатор CSV для анализа каждой строки как тройки.

Обязательно прочтите документацию для разработчиков о том, как форматируются дампы данных. По сути, каждая строка образует тройку, состоящую из подлежащего, сказуемого и дополнения. Чтобы получить все данные о фильмах, вам нужно искать триплеты, предикат которых начинается с /film/.

person Shawn Simister    schedule 10.05.2013
comment
Я попытался использовать уже созданный синтаксический анализатор, такой как CsvReader, и он вызвал ошибку: в LumenWorks.Framework.IO.dll произошло необработанное исключение типа «LumenWorks.Framework.IO.Csv.MalformedCsvException». есть идеи? - person Gidi; 11.05.2013
comment
Вы сказали ему разделять на табуляции, а не запятыми? Также вам может понадобиться указать, чтобы он пропускал первые пару строк, где находятся заголовки префиксов. Однако это сообщение об ошибке может быть чем угодно. - person Shawn Simister; 12.05.2013
comment
не могли бы вы рассказать мне, как искать актеров или режиссеров, пожалуйста? - person Gidi; 12.05.2013
comment
Я также хотел бы получить идентификаторы imdb от API. - person Gidi; 12.05.2013
comment
это запрос, который я хочу freebase.com/query?autorun=1&q=%22id%22:%22/m/ и когда я пытаюсь найти google api, чтобы вернуть json, он вызывает ошибку с этим URL-адресом: googleapis.com/freebase/v1 /mqlread?query={{%22/film/film/imdb_id%22:[],%22id%22:%22/m/027pfg%22}} Что я делаю не так?? - person Gidi; 12.05.2013
comment
stackoverflow .com/questions/17523027/ - person Gidi; 08.07.2013