Как получить потоковые данные из твиттера, подключиться к pycurl с помощью nltk - регулярное выражение

Я новичок в Python, и мой босс дал задание:

Получение потоковых данных из твиттера, соединение с pycurl и вывод в JSON
Парсинг с использованием NLTK и регулярного выражения
Сохраните его в файл базы данных (mySQL) или файловую базу (txt)

Примечание: это URL-адрес, который я хочу получить ('http://search.twitter.com/search.json?geocode=-0.789275%2C113.921327%2C1.0km&q=+near%3Aindonesia+within%3A1km&result_type=recent&rpp = 10 ')

Кто-нибудь знает, как получить потоковые данные из твиттера, используя шаг выше?

Буду очень признателен за вашу помощь :)

sdwinanta 28.07.2011 источник

Ответы (1)

arrow_upward
2
arrow_downward

Я бы посмотрел на шаблон: это очень хорошая библиотека веб-майнинга, и она поставляется с API майнинга Twitter. Документация тоже неплохая.

В противном случае посмотрите https://dev.twitter.com/docs/twitter-libraries. для библиотек twitter, и получение потока тоже должно быть довольно простым.

Savino Sguera 08.08.2011

Как получить потоковые данные из твиттера, подключиться к pycurl с помощью nltk - регулярное выражение

Ответы (1)

Вопросы по теме