Оценка товарного оборудования для приложения

Предположим, я хотел разработать веб-сайт с переполнением стека. Как мне оценить количество стандартного оборудования, необходимого для поддержки этого веб-сайта, при условии, что 1 миллион запросов в день. Существуют ли какие-либо тематические исследования, объясняющие возможные улучшения производительности в этой ситуации?

Я знаю, что узкое место ввода-вывода является основным узким местом в большинстве систем. Каковы возможные варианты повышения производительности ввода-вывода? Немногие из них, которых я знаю,

кэширование
репликация

performance hardware capacity-planning

Boolean 14.01.2010 источник

comment

Вау - это нагруженный вопрос. :) - George Johnston 14.01.2010

comment

Это наука о планировании мощностей, плюс программная архитектура, плюс все остальное, так что ответ 42. - Nikolai Fetissov 14.01.2010

comment

Все ответы были полезными. Спасибо - Бала - Boolean 19.01.2010

Ответы (3)

arrow_upward
2
arrow_downward

Вы можете улучшить производительность ввода-вывода несколькими способами в зависимости от того, что вы используете для настройки хранилища:

Увеличьте размер блока файловой системы, если ваше приложение демонстрирует хорошую пространственную локальность при вводе-выводе или использует большие файлы.
Используйте RAID 10 (распределение + зеркальное отображение) для повышения производительности + избыточности (защита от сбоя диска).
Используйте быстрые диски (Performance Wise: SSD > FC > SATA).
Разделяйте рабочие нагрузки в разное время суток. например Резервное копирование ночью, обычный ввод-вывод приложения днем.
Отключите обновления atime в своей файловой системе.
Обработчики кэш-файлов NFS, также известные как Haystack (Facebook), при хранении данные на NFS-сервере.
Объединение небольших файлов в более крупные фрагменты, также известные как BigTable, HBase.
Избегайте очень больших каталогов, т. е. большого количества файлов в одном каталоге (вместо этого разделяйте файлы по разным каталогам в иерархии).
Используйте кластеризованный система хранения (да, не совсем обычное оборудование).
По возможности оптимизируйте/разработайте свое приложение для последовательного доступа к диску.
Используйте memcached. :)

Вы можете просмотреть раздел «Извлеченные уроки» в StackOverflow Architecture. .

Sudhanshu 14.01.2010

comment

10. Оптимизируйте/разработайте свое приложение для последовательного доступа к диску, когда это возможно. Как этого добиться, учитывая такой веб-сайт, как переполнение стека. 7 Объединяйте небольшие файлы в более крупные фрагменты, также известные как BigTable, HBase. Я думаю, что это распределенная база данных с ключевым значением. Есть ли учебник? - Boolean; 14.01.2010

comment

HBase основан на Google BigTable. В ссылке на HBase, которую я предоставил, есть все, что вам нужно для начала работы (но HBase может не обязательно быть лучшим решением для того, что вам нужно - сначала определите свои точные требования к хранилищу данных, а затем решите, подходит ли он для того, что вы хотите). Для чего-то вроде stackoverflow вам нужно выяснить, какие наиболее распространенные операции выполняются (после запуска сайта потребуются измерения, мониторинг и т. д.). Тогда вы захотите оптимизировать самые верхние операции. Помните, что оптимизация происходит после развертывания (даже если ее нужно немного переписать). - Sudhanshu; 14.01.2010

comment

Вы можете попробовать это для HBase: stackoverflow.com/questions/tagged/hbase stackoverflow.com/questions/1750556/ - Sudhanshu; 15.01.2010

arrow_upward
1
arrow_downward

проверьте этот удобный инструмент:

http://www.sizinglounge.com/

и еще одно руководство от Dell:

http://www.dell.com/content/topics/global.aspx/power/en/ps3q01_graham?c=us&l=en&cs=555

если вам нужно собственное сообщество, похожее на stackoverflow, вы можете зарегистрироваться на StackExchange.

Вы можете прочитать некоторые тематические исследования здесь:

Высокая масштабируемость: как Rackspace теперь использует MapReduce и Hadoop для запроса терабайтов данных http://highscalability.com/how-rackspace-now-uses-mapreduce-and-hadoop-query-terabytes-data

http://www.gear6.com/gear6-downloads?fid=56&dlt=case-study&ls=Veoh-Case-Study

jspcal 14.01.2010

comment

Собственно вопрос у меня общий и не хочется покупать дорогостоящие сервера. Я планирую написать приложение Hadoop для анализа данных. Я просто хочу знать, есть ли какие-либо тематические исследования по этому поводу. - Boolean; 14.01.2010

comment

попробуйте это исследование: highscalability.com/ - jspcal; 15.01.2010

arrow_upward
1
arrow_downward

1 миллион запросов в день — это 12 запросов в секунду. Переполнение стека достаточно мало, чтобы его можно было (с интересными приемами нормализации и сжатия) полностью поместить в ОЗУ 64-гигабайтного Dell PowerEdge 2970. Я не уверен, где кэширование и репликация должны играть роль.

Если у вас есть проблемы с мыслью о нормализации, доступен PowerEdge R900 с 256 ГБ.

Если вам не нравится единая точка отказа, вы можете подключить несколько из них и просто отправлять обновления через сокет (желательно на отдельную сетевую карту). Даже пиковая нагрузка 12 КБ/с не должна быть проблемой для системы с оперативной памятью.

Лучший способ избежать узкого места ввода-вывода — не выполнять ввод-вывод (насколько это возможно). Это означает подобную превайлеру архитектуру с пакетной записью (не проблема потерять несколько секунд данных), в основном файл журнала, а для репликации также записывать их в сокет.

Stephan Eggermont 14.01.2010

comment

но есть проблема с единой точкой отказа справа. как вы этого избежите. - Boolean; 14.01.2010

Оценка товарного оборудования для приложения

Ответы (3)

Вопросы по теме