We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Network Manipulation

Network Manipulation

2025/4/30
logo of podcast Data Skeptic

Data Skeptic

AI Deep Dive Transcript
People
M
Manita Pote
Topics
Manita Pote: 我主要研究在线信任与安全,重点关注社交媒体上的协调滥用行为,例如协调回复攻击,这是一种通过协调评论来影响公众舆论或骚扰特定目标的策略。我的研究包括识别这些攻击的目标(例如记者、政治人物)、开发检测这些攻击的机器学习框架(包括预测哪些推文可能成为目标以及哪些用户参与其中),以及分析数据结构(例如树状结构和星状结构)的挑战。我们使用推文级和回复级特征,包括回复之间的相似性,来构建模型。模型评估指标包括精确率、召回率和AUC分数。虽然模型在某些活动中表现良好,但在其他活动中表现不佳,这可能与不同活动中使用的策略有关。 此外,我还研究了数据删除在社交媒体操纵中的作用。我们发现,通过删除推文,恶意行为者可以规避API限制、操纵算法以及隐藏其活动。这项研究利用合规数据流来估计删除行为的规模,发现API数据会低估大约45%的删除行为。删除行为的动机可能包括商品促销、粉丝操纵和垃圾邮件活动。 目前,我的研究重点是第三方应用程序如何被用于协调操纵活动,这与Cambridge Analytica事件类似,但视角不同。我关注的是这些活动的物流和运营方面,而不是账户行为。生成式AI的使用使得检测协调操纵活动变得更加困难,这给研究人员带来了新的挑战。 Kyle: 在与Manita Pote的访谈中,我们探讨了社交媒体上协调操纵的复杂性,特别是协调回复攻击。这些攻击通常针对有影响力的人物,例如记者和政治家。Manita Pote的研究重点是利用机器学习模型检测这些活动,该模型使用结构和行为特征来识别参与者和受攻击的推文。此外,我们还讨论了数据删除在规避审核和操纵参与度指标中的作用,以及学术界与平台之间在数据访问和隐私保护方面的平衡问题。Manita Pote的研究为应对社交媒体上的协调操纵提供了宝贵的框架,并突出了生成式AI带来的新挑战。

Deep Dive

Shownotes Transcript

In this episode we talk with Manita Pote, a PhD student at Indiana University Bloomington, specializing in online trust and safety, with a focus on detecting coordinated manipulation campaigns on social media. 

Key insights include how coordinated reply attacks target influential figures like journalists and politicians, how machine learning models can detect these inauthentic campaigns using structural and behavioral features, and how deletion patterns reveal efforts to evade moderation or manipulate engagement metrics.

Follow our guest

X/Twitter) Google Scholar)

Papers in focus Coordinated Reply Attacks in Influence Operations: Characterization and Detection ,2025) Manipulating Twitter through Deletions,2022)