У меня есть ссылки на страницы contact_us с веб-сайтов почти 100 компаний. Мне нужно собрать адреса всех компаний, которые есть на каждой странице contact_us. Я пытаюсь использовать Jsoup, но если я использую Jsoup, это будет специфично для одной компании. Я должен реализовать общую реализацию.
Я рассматриваю следующую стратегию:
- Везде, где мы находим такие ключевые слова, как офис, штаб-квартира и т. д. Я думал прочитать этот блок.
Например, см. эту ссылку: http://www.directenergysolar.com/company/contact-us/
На этой странице я должен собрать все адреса.
Есть ли лучший способ реализовать это?