Извлечь все твиты по теме из вчерашнего дня с помощью Python Tweepy?

Кажется, что Python API позволяет людям откопать твиты, написанные пару дней назад. Поскольку мне не нужно мгновенно транслировать твиты, но я хочу собирать все твиты по определенной теме (например, быстрой машине) за определенный период, я думаю, что запуск скрипта python, собирающего все твиты по теме из «вчерашнего дня», позволит делать. Следующие коды делают что-то подобное, но я могу получить только заранее указанную сумму (например, 200), я могу увеличить это число до очень большого (например, 50 000), но есть ли лучший способ захватить ВСЕ твиты на тема накануне?

import tweepy
import time

ckey = ""
csecret = ""
atoken = ""
asecret = ""

OAUTH_KEYS = {'consumer_key':ckey, 'consumer_secret':csecret,
    'access_token_key':atoken, 'access_token_secret':asecret}
auth = tweepy.OAuthHandler(OAUTH_KEYS['consumer_key'], OAUTH_KEYS['consumer_secret'])
api = tweepy.API(auth)

# Extract the first "xxx" tweets related to "fast car"
for tweet in tweepy.Cursor(api.search, q='fast-car', since='2014-09-14', until='2014-09-15').items(200): # need to figure out how to extract all tweets in the previous day
    if tweet.geo != None:
        print "////////////////////////////////"
        print "Tweet created:", tweet.created_at
        print ""

person KubiK888    schedule 16.09.2014    source источник


Ответы (2)


Чтобы попытаться ответить на этот вопрос, я мог бы установить количество извлекаемых элементов как гипотетически огромное число, например элементы (999999999), и как только скрипт извлечет все твиты за предыдущий день, он автоматически остановится.

person KubiK888    schedule 17.09.2014

Просто не указывайте число в качестве параметра, и он вернет их все.

person Neil Du Toit    schedule 01.03.2018
comment
когда вы не предоставляете .items (200) в конце, вы получаете сообщение об ошибке «Курсор» не повторяется. - person Akshay Kadidal; 27.08.2020