Tweepy截断状态 [英] Tweepy Truncated Status

查看:12
本文介绍了Tweepy截断状态的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我在使用tweepy挖掘用户时间线数据时,遇到了一些理解以下问题的困难:

  1. ‘reweetted’和‘truncated’属性是否指的是同一件事(即超过140个字符的状态文本)?
  2. 如果不是,有什么不同?
  3. 我遇到了一个堆栈溢出问题,有人问如何检索由于长度超过140个字符而被‘砍’掉的状态文本。它建议在_json词典中有一个转发的属性,如果是这样的话,这将是正确的,并且完整的状态文本将在Status->Retweted_Status->Text下。然而,我一直没有找到它,唯一的状态文本是在Status->Text以‘...’结尾的下面。我是否弄错了?如果是,我如何获取全文?

提前感谢您的帮助。

推荐答案

‘reweetted’和‘truncated’属性是指同一事物(即超过140个字符的状态文本)吗?如果不是,有什么不同?

不,tweet不仅可以在转发后截断,也可以在回复或提及后截断(参见下面不是转发的示例)。如果是这种情况,‘Truncated’将被设置为‘True’(而‘Retweet’将为True或False)。如果推文没有被截断,因为其长度远低于140个字符,则也可以将‘reweet’设置为True,而将‘Truncted’设置为False。

它建议_json词典中存在转发属性,如果是这种情况,则为真,并且完整状态文本将位于STATUS->RETWETED_STATUS->TEXT下。

只有当推文是真正的转发时,才会出现这种情况。实际上,如果来自另一条被截断的tweet,那么RETWETED_STATUS本身可能会被截断。最好的方法是使用Tweepy中的tweet_mode='extended'参数来检索全文(遗憾的是,Tweepy文档中没有记录)。例如:

(未扩展)

print api.get_status('862328512405004288')._json['text']
@tousuncoteFoot@EquiithFrance@CreditAgricole@AntoGriezmann@KMbappe@layvinkurzawa@Umtisam J‘ai Jamais vue d…https://tco/kALZ2ki9Vc

(扩展)

print api.get_status('862328512405004288', tweet_mode='extended')._json['full_text']

@tousuncoteFoot@EquiithFrance@CreditAgricole@AntoGriezmann@KMbappe@layvinkurzawa@UmtitiSam J‘ai Jamais vue de Match de Foot et Cela ferait un beau cadeau our mon Copain!!🙏🏻🙏🏻🙏🏻😍😍

这篇关于Tweepy截断状态的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆