Если вы посмотрите любую статью TechCrunch, в которой объявляется о последнем раунде финансирования для следующего многообещающего стартапа, вы заметите, что размер капитала, привлеченного компанией, приравнивается к качеству инвесторов, которые делают ставку на компанию. . Взяв пример с начала этого лета, рассмотрим Grammarly 110 миллионов долларов от General Catalyst, IVP и Spark Capital, чтобы вывести свой бизнес на новый уровень. Действительно, довольно часто оценивают потенциал стартапа по тому, сколько капитала он привлек, а также по тому, от кого.

Если вы опытный венчурный капиталист или хорошо закаленный основатель стартапа, то размышления о качестве капитала, стоящего за стартапом, скорее всего, для вас очень естественны. Однако для других такое мышление, вероятно, необычно. Существует разница между привлечением 10 миллионов долларов от одного учреждения к другому, не только в опыте сбора средств, но и в конечных результатах (у нас есть собственные оценки вероятности успеха для каждого фонда венчурного капитала, но мы ссылаемся на твит Чамата Палихапитии для социальная проверка).

Идея кажется достаточно простой, но эта мысль привела к интересным исследованиям в лаборатории Data Science компании Radicle, которые привели к чисто математическому выражению сигнала, генерируемого таблицей капитализации стартапа.

По сути, мы создали алгоритм, который подтверждает ваши предположения. Рассмотрим два недавно профинансированных стартапа: Gamma и Theta. Если Gamma поддерживается Sequoia Capital, Benchmark и Accel Partners, а Theta финансируется исключительно Sequoia Capital, то вы интуитивно считаете, что Gamma должна быть в некотором роде более привлекательной, даже если Sequoia Capital присутствует в обоих наборах. Добавление Benchmark и Accel Partners в набор Gamma дает нам больше сигналов. Трудно описать, но с Gamma у нас есть качественная проверка двух дополнительных институтов с большим капиталом и огромной репутацией.

В целом, мы считаем, что убедить не одного, а нескольких гигантских венчурных капиталистов спонсировать идею невероятно сложно, и эта вера дает нам больше уверенности в стартапе, который может это сделать. Возможно, это связано с тем, что это означает, что генеральный директор может быть отличным стратегом, или что у стартапа больше, чем обычно, соответствие продукта рынку или сильное раннее привлечение клиентов. Мы не совсем уверены, почему, но наши прежние убеждения заставляют нас обычно оценивать потенциал стартапа по качеству его инвесторов. Конечно, это не гарантия успеха - венчурный капитал - это игра вероятностей, - но тем не менее он вселяет в нас больше уверенности. Настолько, что это важный компонент любого пресс-релиза, объявляющего раунд финансирования.

Поскольку это настолько банально, я решил, что мы должны попытаться измерить это, и что ж, у нас есть - и мы называем это Investor Cluster Score ™ (ICS). Как и большинство других вещей в лаборатории обработки данных Radicle, ICS изначально возникла, когда я придумывал дополнительные функции для нашего алгоритма Startup Anomaly Detection ™, который оценивает вероятность того, что стартап достигнет выхода посредством первичного публичного предложения или приобретения. В результате ICS была разработана с учетом того, что большая часть информации, доступной инвесторам, является шумом, и поэтому построена с общей целью извлечения объективно значимого сигнала для целей прогнозирования.

Как это работает
В общих чертах, Investor Cluster Score ™ рассчитывается с помощью алгоритма, который оценивает информацию, содержащуюся в нескольких отдельных сигналах, включая размер фирм венчурного капитала, уровень их инвестиций. активности и зрелости по сравнению с коллегами. Средние результаты не включены в нашу функциональную область, потому что, как упоминалось выше, венчурный капитал - это игра вероятностей. Мы предполагаем, что фонды, привлекающие больше капитала, исторически были в чем-то более успешными и, следовательно, более заметными в умах людей (то есть более сильным сигналом). Мы начинаем с вычисления VC Prominence Score ™ для всех венчурных капиталистов, микро-венчурных капиталистов, акселераторов, инкубаторов, бизнес-ангелов и частных лиц с не менее чем 50 предыдущими инвестициями.

Приведенное выше искаженное распределение предполагает, что существует всего несколько десятков институтов венчурного капитала, которые производят действительно сильный рыночный сигнал - ваши Мировые Секвойи. Мы думаем, что это точное представление реальной действительности, потому что их действительно не так много. Также обратите внимание, что несколько ускорителей, инкубаторов и отдельных лиц имеют более высокие оценки, чем многие полноценные венчурные компании (вспомните Y Combinator, Techstars, Peter Thiel, Yuri Milner, Fabrice Grinda).

Затем мы вычисляем рейтинг Investor Cluster Score ™ путем агрегирования рейтинга VC Prominence Score ™ каждого инвестора, который отображается в таблице капитализации стартапа. Это нетривиальная инженерная задача на стыке обработки естественного языка и анализа данных, но конечным результатом является вектор, отражающий характеристики капитала, стоящего за стартапом. Алгоритм даже учитывает каждый раз, когда венчурный инвестор удваивает свою веру в стартап (подробнее об этом ниже).

В настоящее время мы не выпускаем VC Prominence Scores ™, потому что (1) мы занимаемся анализом сигналов от стартапов, а не ранжируем инвестиционные организации, и, возможно, что более важно (2) мы на самом деле не верим в Ранжирование венчурных капиталистов, производимое нашим алгоритмом, равно как и какой-либо конкретный рейтинг, не может обеспечить окончательный ранг венчурных капиталистов. Говоря абстрактно, некоторые фонды, вероятно, лучше других в очень уникальных аспектах, отраслях или этапах, и все это действительно зависит от вашей конечной цели. Наша цель состояла в том, чтобы создать чисто математическое выражение информации, содержащейся в таблице капитализации стартапа, и наши результаты не только интуитивно понятны, но и полезны. В науке о данных иногда действительно имеет значение полезность.

Итак, каковы результаты и почему меня это должно волновать?
На очень фундаментальном уровне Investor Cluster Score ™ представляет собой интересный показатель, поскольку он указывает на потенциал выхода (высокая важность функции в жаргон науки о данных). Это означает, что существует статистически положительная корреляция между сигналом из таблицы капитализации стартапа, измеренной ICS (нормализованный квадратный корень), и их вероятностью выхода (регрессия OLS, p .

Для целей отчетности значения ICS обычно нормализованы до диапазона от 0 до 100, и по состоянию на октябрь 2017 года среднее значение ICS для всех стартапов в нашей базе данных составляет 5,1 со стандартным отклонением 9,4. У Slack самый высокий предварительно нормализованный балл в истории, и поэтому он является эталоном, по которому анализируются все другие стартапы. Таблица капитализации Slack включает в алфавитном порядке: Accel Partners, Andreessen Horowitz, GGV Capital, GV, Horizons Ventures, Index Ventures, Institutional Venture Partners, Kleiner Perkins Caufield & Byers, Slow Ventures, Social Capital, Spark Capital, SV Angel и Thrive Capital. Не только это, но и большинство этих громких имен неоднократно инвестировали в компанию. Дополнительные ориентиры включены в таблицу ниже.

Важный вывод здесь заключается в том, что стартапы с высоким потенциалом, как правило, имеют значения ICS на несколько стандартных отклонений выше среднего. Таким образом, интерпретировать рейтинг Investor Cluster Score ™ довольно просто - чем больше, тем лучше. Предварительная нормализация ICS технически представляет собой набор действительных чисел от нуля до положительной бесконечности. Это тоже динамично. Если фундаментальные характеристики венчурной фирмы изменяются, то соответствующие баллы по всем ее инвестициям корректируются, хотя на практике эти изменения вряд ли являются кардинальными. Проведение аналитического вывода с помощью ICS также несложно и, как правило, требует только дополнительного контекста количества раундов, которые потребовались стартапу для достижения того балла, который у него есть. Это связано с тем, что, как показано на рисунке ниже, значения ICS имеют тенденцию незначительно увеличиваться по мере увеличения раундов финансирования (регрессия OLS, p ‹0,001, R-квадрат = 0,1).

Несмотря на то, что алгоритм ICS контролирует общее количество раундов финансирования, эта взаимосвязь, вероятно, все еще очевидна из-за двух различных факторов: во-первых, известные фирмы венчурного капитала, как правило, объединяются вокруг стартапа, когда он начинает демонстрировать высокий уровень поддержки, обычно после несколько раундов финансирования. По мере того как венчурные фирмы стремятся оптимизировать свой портфель стартапов, они стремятся инвестировать в компании, которые могут добиться выхода (причем большого). Поскольку венчурные капиталисты, вероятно, одновременно смотрят на очень похожие сигналы роста, они, вероятно, приходят к схожим выводам и, как следствие, имеют тенденцию группироваться вокруг нескольких стартапов, которые могут демонстрировать статистически значимые отклонения от нормы (норма - провал).

Во-вторых, ICS учитывает каждый раз, когда венчурный фонд делает последующие инвестиции. Итак, если Andreessen Horowitz инвестирует в стартап дважды, Andreessen Horowitz учитывается дважды. У этого методологического принципа есть явные достоинства и недостатки. Мы основали это решение на том факте, что, в общем, кажется, существует фундаментальная разница между стартапом, который убеждает своих видных инвесторов выписать еще один чек, и тем, который этого не делает (не считая предубеждений инвесторов). Мы считаем, что это различие не является маргинальным и, следовательно, достаточно важным, чтобы оправдать захват в нашем векторном пространстве. Другие могут не согласиться. В любом случае связь между ICS и раундами финансирования довольно слабая (R-squared = 0,1) и явно недетерминированная, поэтому, хотя это статистически значимый и, следовательно, важный фактор, который следует учитывать при проведении аналитического вывода, он не совсем необходимо.

Применение ICS ™ в сравнительной аналитической структуре
Хотя, возможно, интеллектуально интересно узнать «от 0 до Slack», как компании позиционируются с точки зрения их таблицы капитализации, мы полагаем, что рейтинг кластера инвесторов ™ лучше всего подходит для сравнительной аналитической основы отраслевых отчетов Radicle. Это полезно, когда вы пытаетесь понять, как отдельные стартапы в недавно разрушенной отрасли позиционируются по отношению к своим сверстникам.

Например, недавно Radicle покрыла недавно нарушившееся страхование арендаторов и домовладельцев. Глядя на распределение ICS в этом секторе, мы сразу можем понять, что Lemonade лидирует с 46 ICS из четырех раундов финансирования (наравне с Twitter).

Jetty и Hippo Insurance также дают сильные положительные сигналы из своих таблиц капитализации, каждая из которых имеет ICS выше среднего по результатам второго раунда институционального финансирования. Страхование квилтов и бунгало с этой точки зрения менее интересно, учитывая, однако, то, что подавляющее большинство стартапов имеют нулевую ICS. Таким образом, ICS в размере 2 за один раунд финансирования звучит многообещающе. Swyfft не получает оценку, поскольку он публично не раскрыл свой источник капитала. Наш алгоритм оценки в конечном итоге зависит от публично раскрытых данных. Итак, если что-то не разглашается, к сожалению, мы не узнаем об этом - и никто другой - и это нормально.

Заключительные замечания
Ой, подождите, мы забыли о Grammarly! После всего этого, что такое Grammarly’s Investor Cluster Score ™?

Оказывается, наличие General Catalyst, Institutional Venture Partners (IVP) и Spark Capital в их первом раунде институционального капитала дает Grammarly ICS 20,5, что более чем на 1,5 стандартных отклонения выше среднего, что свидетельствует о том, что они действительно начинают свой бизнес. на следующий уровень. Это уже не качественное суждение, а, скорее, поддающийся количественной оценке факт.

Количественно оценивая сигнал из таблицы капитализации каждого стартапа, ICS помогает нам лучше понимать и оценивать компании в разрушительной среде и открывает возможность взглянуть на конкуренцию стартапов в новом свете.

Дополнительные перспективы