Polarity-Aware Probing Datasets - a SabrinaSadiekh Collection

SabrinaSadiekh 's Collections

updated 3 days ago

Datasets for PA-Probing described in "Polarity-Aware Probing for Quantifying Latent Alignment in Language Models" https://www.arxiv.org/pdf/2511.21737

Upvote

SabrinaSadiekh/mixed_hate_dataset

Viewer • Updated 7 days ago • 1.24k • 89 • 2
SabrinaSadiekh/not_hate_dataset

Viewer • Updated 7 days ago • 1.25k • 71 • 1

Upvote

Collection guide
Browse collections