Так что это немного безумная идея, над которой я размышлял. Я подумываю создать классификатор для (специализированного подмножества) некоторого веб-контента, а затем предоставить его пользователям в виде расширения Chrome. (Итак: пользователь переходит на веб-страницу, нажимает кнопку на расширении Chrome, расширение применяет предварительно обученную модель для создания прогноза, представляет результат пользователю.)
Но я дешев, и я не хочу запускать сервер для получения данных от расширения Chrome, создания прогноза и отправки его пользователю. Мне приходит в голову: почему бы просто не найти способ сериализовать обученную модель или что-то в этом роде, и сделать все это на стороне клиента.
Так что, если я в конечном итоге подгоню очень простую модель, например, логистическую регрессию или что-то в этом роде, то ее будет легко перенести на клиентскую сторону. В конечном счете, обученная логистическая регрессия просто выражается как обычная математическая функция, отображающая функции предсказаний, это как одна строка кода. И я думаю, что это верно и для некоторых более модных моделей (линейный SVM). В этих условиях расширение Chrome могло бы выполнять всю очистку данных и тому подобное, а затем создание прогнозов - это просто вопрос вычисления скалярного произведения. Но то же самое не так, если я в конечном итоге использую, скажем, случайные леса или что-то в этом роде.
К сожалению, не существует библиотеки PMML или чего-либо подобного для javascript.
Итак, я обращаюсь к мудрости Интернета. Есть ли другие методы создания моделей машинного обучения, которые можно было бы использовать на клиентском javascript? Или варианты действительно просто (1) запустить сервер, (2) написать библиотеку PMML для JS, (3) нет третьего варианта?
Спасибо!