Открытые альтернативы Google Prediction API

Недавнее объявление Google об Google Prediction API звучало очень интересно. Это может быть полезно для готовящегося проекта и, вероятно, будет работать лучше, чем какой-то пользовательский код, который я рассматривал.

Тем не менее, есть некоторая привязка к поставщику. Google сохранит обученную модель и позже может завысить цену за нее. Мне пришло в голову, что, вероятно, есть эквиваленты с открытым исходным кодом, если бы я был готов провести обучение сам (я готов) и жить без их возможности использовать оборудование для решения проблемы в любой момент.

В последний раз, когда я просматривал программный код для компьютерного обучения сторонних производителей, это было много лет назад, и в нем было много деталей, которые нужно было тщательно продумать и настроить для своего проекта. Похоже, что Google скрыл эти решения и позаботится о них за вас. Для меня это все еще неотличимо от магии, но я хотел бы услышать, могут ли другие сделать то же самое.

Итак, мой вопрос:

Какие существуют альтернативы Google Prediction API, которые:

  • классифицировать данные с помощью контролируемого машинного обучения,
  • можно легко настроить (или не нужно настраивать) для разных видов и масштабов наборов данных?
  • имеют открытый исходный код и размещаются на собственном хостинге (или, по крайней мере, предоставляют вам бесплатное использование вашей модели без зависимости от третьей стороны)

person Oddthinking    schedule 18.08.2010    source источник


Ответы (5)


Может быть, Apache Mahout?

person tszming    schedule 19.08.2010
comment
Похоже на хорошее решение. Еще рано (по их собственному признанию, v0.3). Они решают более широкий круг задач, чем просто классификация. - person Oddthinking; 19.08.2010
comment
Да, но это выглядит многообещающе, поскольку они предназначены для крупномасштабной обработки данных. - person tszming; 20.08.2010

PredictionIO – это сервер машинного обучения с открытым исходным кодом, с помощью которого разработчики программного обеспечения могут создавать функции прогнозирования, такие как персонализация, рекомендации и обнаружение контента.

person NARKOZ    schedule 27.11.2013
comment
Превосходно. Он построен на основе библиотеки Apache Mahout (по крайней мере, для алгоритмов по умолчанию). Кажется, он не поддерживает общую классификацию, а только прогнозирует предпочтения пользователя. - person Oddthinking; 27.11.2013

Недавно я смотрел на такие инструменты, как API прогнозирования Google, одним из первых, который мне попался, был Weka инструмент машинного обучения, на который стоит обратить внимание всем, кто ищет.

person purchas    schedule 10.09.2012

Я не уверен, что это актуально, но directededge похоже делает именно это :)

person tUrG0n    schedule 09.07.2012
comment
Они, кажется, предоставляют услугу, как Google. Это не самообслуживание, так что это не ответ. - person Oddthinking; 10.07.2012
comment
Проект отложили на второй план. Может быть, еще через год или два — вероятно, когда Mahout достигнет версии 1.0! ! :-) - person Oddthinking; 10.07.2012
comment
Это 2015 год, и на версии 0.10. Через 40 лет у нас будет стабильная версия 1.0. - person Mysteryos; 07.05.2015

Есть хороший бесплатный сервис Яндекс Предиктор с квотой запросов 100000/день. Он работает только для текста, поддерживает несколько языков и исправление орфографии.

Вам нужно получить бесплатный ключ API, после чего вы можете использовать простой RESTful API. API поддерживает JSON, XML и JSONP в качестве вывода.

К сожалению, я не могу найти документацию на английском языке. Вы можете использовать Google Translate.

Я могу перевести документы, если есть спрос.

person dasar    schedule 04.07.2015