Когда только один процесс может прослушивать и принимать заданную комбинацию IP-адреса и порта, тогда как веб-серверы масштабируются, чтобы прослушивать миллионы входящих запросов? Этот вопрос связан с выяснением схемы программирования сокетов для масштабирования, поэтому я не ищу балансировку нагрузки с помощью решений аппаратного масштабирования, и я ищу не реализации веб-сокетов, а базовое программирование сокетов низкого уровня.
Если мне нужно написать веб-сервер, слушающий входящий HTTP-запрос, какова должна быть схема проектирования потока, слушающего входящий запрос, чтобы он мог масштабироваться до миллионов входящих запросов?