Примеры использования Google Prediction API

Кто-нибудь здесь использовал Google Prediction API? За что? Это "сработало"?


person user94154    schedule 16.01.2011    source источник


Ответы (2)


Если вы ищете реальный случай, посмотрите этот, который автоматически назначает приоритет ошибкам.

Я также создал пару тестовых проектов, чтобы понять, как я могу использовать его в производстве.

Один из них предлагает теги для вопросов Stackoverflow. Модель для этого обучалась на вопросах (из дампа данных), которые имели только 1 тег. Это помогает ему распознавать особенности конкретного тега. Код и проза были разделены на отдельные функции, так как одна из них может иметь большее влияние на результат. Когда задан вопрос, он возвращает 10 лучших предложений тегов; фактические теги включены для сравнения.

Структура представляла собой файл CSV:

"tag","code blocks(200 chars)","body text(200 chars)"

Некоторые символы были отфильтрованы из code, что вызвало ошибки обучения: []^|~. Не уверен, что из них вызывало проблемы.

Если вы хотите, чтобы определенный вопрос был добавлен в список тестов, дайте мне знать. Очевидно, что вопросы, в которых есть код, предсказуемы лучше.

Другой проект прогнозирует рейтинги фильмов на основе данных IMDB и информации о режиссерах/актёрах. В отличие от подсказчика тегов, этот работает, поэтому вы можете поэкспериментировать с различными комбинациями, чтобы увидеть, что он предскажет.

Структура здесь была:

rating,"directorId","actorId actorId actorId"

Оба работают на Google App Engine, поэтому python является серверной частью. Я не использую конкретный API; только что следовал некоему примеру кода Ника Джонсона.

person hyperslug    schedule 31.01.2011
comment
Потрясающий! Именно то, что я хотел увидеть! - person user94154; 31.01.2011
comment
К сожалению, ссылки в ответе больше не доступны в Интернете. У кого-нибудь есть обновленные примеры? - person Herman Schaaf; 16.01.2013

Я не использовал этот API. Но их списки веб-сайтов приведены ниже.

  • Системы рекомендаций (демо-код)
  • Обнаружение спама (демо-код)
  • Анализ настроений клиентов
  • Анализ возможностей допродажи
  • Решения о маршрутизации сообщений
  • Диагностика
  • Классификация документов и электронной почты
  • Выявление подозрительной активности
  • Анализ оттока
  • Идентификация языка
person Aravind Yarram    schedule 16.01.2011
comment
Спасибо за ответ, но меня в основном интересует, для чего/как они использовали его, не являясь сотрудниками Google (например, какой язык/библиотека, как они обрабатывали сбор данных, как они структурировали данные и т. д.). - person user94154; 16.01.2011