From 168d80b6d591b181501749d6ad005dd81090eba1 Mon Sep 17 00:00:00 2001
From: Fer Aguirre <77854667+fer-aguirre@users.noreply.github.com>
Date: Tue, 16 Jan 2024 23:19:02 -0600
Subject: [PATCH] Arranged jupyter notebooks
---
_notebooks/1.0-analyze.ipynb | 253 ++----
_notebooks/1.1-analyze.ipynb | 1549 +++++++++++++++++++++++++++++++---
_notebooks/1.2-analyze.ipynb | 1128 +++++++++++++++++++++++--
_notebooks/1.3-analyze.ipynb | 1021 ++--------------------
_notebooks/1.4-analyze.ipynb | 1149 -------------------------
5 files changed, 2663 insertions(+), 2437 deletions(-)
delete mode 100644 _notebooks/1.4-analyze.ipynb
diff --git a/_notebooks/1.0-analyze.ipynb b/_notebooks/1.0-analyze.ipynb
index 92b5b1a..f01e44c 100644
--- a/_notebooks/1.0-analyze.ipynb
+++ b/_notebooks/1.0-analyze.ipynb
@@ -2,261 +2,142 @@
"cells": [
{
"cell_type": "code",
- "execution_count": 1,
+ "execution_count": 26,
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd\n",
"import numpy as np\n",
- "import spacy\n",
- "import re\n",
- "import plotly.express as px\n",
- "\n",
- "nlp = spacy.load('es_core_news_sm')"
+ "from tqdm import tqdm\n",
+ "import torch\n",
+ "from transformers import AutoTokenizer, AutoModelForSequenceClassification"
]
},
{
"cell_type": "code",
- "execution_count": 9,
+ "execution_count": 27,
"metadata": {},
"outputs": [
{
- "name": "stdout",
+ "name": "stderr",
"output_type": "stream",
"text": [
- "55374\n"
+ "Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.\n"
]
}
],
"source": [
- "df = pd.read_csv('../data/raw/elecciones_argentina.csv')\n",
- "\n",
- "# Convert the 'date_local' column to datetime format\n",
- "df['date_local'] = pd.to_datetime(df['date_local'])\n",
- "\n",
- "print(len(df))"
+ "model_name = \"piubamas/beto-contextualized-hate-speech\"\n",
+ "# Load tokenizer and model\n",
+ "tokenizer = AutoTokenizer.from_pretrained(model_name)\n",
+ "model = AutoModelForSequenceClassification.from_pretrained(model_name)"
]
},
{
"cell_type": "code",
- "execution_count": 3,
+ "execution_count": 30,
"metadata": {},
"outputs": [
{
- "data": {
- "text/plain": [
- "0 [#DebatePresidencial2023]\n",
- "1 NaN\n",
- "2 NaN\n",
- "Name: hashtags, dtype: object"
- ]
- },
- "execution_count": 3,
- "metadata": {},
- "output_type": "execute_result"
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "55374\n"
+ ]
}
],
"source": [
- "df['hashtags'] = df['text'].apply(lambda x: np.nan if pd.isnull(x) or not isinstance(x, str) or len(re.findall(r'#\\w+', x)) == 0 else re.findall(r'#\\w+', x))\n",
+ "df = pd.read_csv('../data/raw/elecciones_argentina.csv')\n",
"\n",
- "df['hashtags'].head(3)"
+ "print(len(df))"
]
},
{
"cell_type": "code",
- "execution_count": 4,
+ "execution_count": 31,
"metadata": {},
"outputs": [
{
- "data": {
- "text/plain": [
- "0 #DebatePresidencial2023\n",
- "1 NaN\n",
- "2 NaN\n",
- "Name: hashtags, dtype: object"
- ]
- },
- "execution_count": 4,
- "metadata": {},
- "output_type": "execute_result"
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "52476\n"
+ ]
}
],
"source": [
- "df['hashtags'] = df['hashtags'].apply(lambda x: ', '.join(x) if isinstance(x, list) else x)\n",
+ "filtered_df = df.dropna(subset=['text'])\n",
"\n",
- "df['hashtags'].head(3)\n"
+ "print(len(filtered_df))"
]
},
{
"cell_type": "code",
- "execution_count": 5,
+ "execution_count": 32,
"metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "#MileiPresidente 52\n",
- "#Debate2023 51\n",
- "#MassaPresidente 40\n",
- "#EleccionesArgentina2023 32\n",
- "#DebatePresidencial2023 26\n",
- "#DebatePresidencial 25\n",
- "#Milei 24\n",
- "#Elecciones2023 21\n",
- "#MileiPresidente2023 21\n",
- "#MassaPresidente2023 21\n",
- "#Argentina 20\n",
- "#Massa 20\n",
- "#Viviana1079 18\n",
- "#ElClubDelMoro 17\n",
- "#MileiVillarruel2023 16\n",
- "#MileiNo 16\n",
- "#MassaNoVasASerPresidente 15\n",
- "#EleccionesArgentina 13\n",
- "#GranHermano 12\n",
- "#PatoPresidente 12\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 5,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
+ "outputs": [],
"source": [
- "# convert dataframe column to list\n",
- "hashtags = df['hashtags'].unique()\n",
- "\n",
- "# remove nan items from list\n",
- "hashtags = [x for x in hashtags if not pd.isna(x)]\n",
- "\n",
- "# split items into a list based on a delimiter\n",
- "hashtags = [x.split(',') for x in hashtags]\n",
+ "id2label = [model.config.id2label[k] for k in range(len(model.config.id2label))]\n",
"\n",
- "# flatten list of lists\n",
- "hashtags = [item for sublist in hashtags for item in sublist]\n",
+ "def predict(*args):\n",
+ " try:\n",
+ " encoding = tokenizer.encode_plus(*args)\n",
"\n",
- "# remove whitespaces\n",
- "hashtags = list(map(lambda x: x.replace(' ', ''), hashtags))\n",
+ " inputs = {\n",
+ " k: torch.LongTensor(encoding[k]).reshape(1, -1) for k in {\"input_ids\", \"attention_mask\", \"token_type_ids\"}\n",
+ " }\n",
"\n",
- "# count items on list\n",
- "hashtags_count = pd.Series(hashtags).value_counts()\n",
+ " output = model.forward(\n",
+ " **inputs\n",
+ " )\n",
"\n",
- "# return first n rows in descending order\n",
- "top_hashtags = hashtags_count.nlargest(20)\n",
+ " chars = list(zip(id2label, list(output.logits[0].detach().cpu().numpy() > 0)))\n",
"\n",
- "top_hashtags"
+ " return [char for char, pred in chars if pred]\n",
+ " \n",
+ " except Exception as e:\n",
+ " # Handle the error appropriately\n",
+ " print(\"An error occurred:\", str(e))\n",
+ " return np.nan"
]
},
{
"cell_type": "code",
- "execution_count": 6,
+ "execution_count": 33,
"metadata": {},
"outputs": [
{
- "data": {
- "text/plain": [
- "0 [SergioMassa, myriambregman, Letra_P]\n",
- "1 NaN\n",
- "2 NaN\n",
- "Name: mentions, dtype: object"
- ]
- },
- "execution_count": 6,
- "metadata": {},
- "output_type": "execute_result"
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "100%|██████████| 52476/52476 [1:06:43<00:00, 13.11it/s]\n",
+ "/tmp/ipykernel_13246/4286658429.py:8: SettingWithCopyWarning: \n",
+ "A value is trying to be set on a copy of a slice from a DataFrame.\n",
+ "Try using .loc[row_indexer,col_indexer] = value instead\n",
+ "\n",
+ "See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy\n",
+ " filtered_df['label'] = outputs\n"
+ ]
}
],
"source": [
- "df['mentions'] = df['text'].apply(lambda x: np.nan if pd.isnull(x) or not isinstance(x, str) or len(re.findall(r'@(\\w+)', x)) == 0 else re.findall(r'@(\\w+)', x))\n",
+ "texts = filtered_df['text'].to_list()\n",
"\n",
- "df['mentions'].head(3)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 7,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "0 SergioMassa, myriambregman, Letra_P\n",
- "1 NaN\n",
- "2 NaN\n",
- "Name: mentions, dtype: object"
- ]
- },
- "execution_count": 7,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "df['mentions'] = df['mentions'].apply(lambda x: ', '.join(x) if isinstance(x, list) else x)\n",
+ "outputs = []\n",
+ "for text in tqdm(texts):\n",
+ " output = predict(text)\n",
+ " outputs.append(output)\n",
"\n",
- "df['mentions'].head(3)"
+ "filtered_df['label'] = outputs"
]
},
{
"cell_type": "code",
- "execution_count": 8,
+ "execution_count": 36,
"metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "edufeiok 1011\n",
- "JonatanViale 880\n",
- "JMilei 486\n",
- "vivicanosaok 480\n",
- "PRossiOficial 435\n",
- "majulluis 433\n",
- "lanacionmas 357\n",
- "SergioMassa 281\n",
- "PatoBullrich 263\n",
- "Gatosylvestre 235\n",
- "C5N 224\n",
- "guadavazquez 213\n",
- "fantinofantino 208\n",
- "luisnovaresio 201\n",
- "todonoticias 195\n",
- "alfleuco 176\n",
- "rialjorge 174\n",
- "VickyVillarruel 148\n",
- "LANACION 136\n",
- "trebuquero 134\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 8,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
+ "outputs": [],
"source": [
- "# convert dataframe column to list\n",
- "mentions = df['mentions'].unique()\n",
- "\n",
- "# remove nan items from list\n",
- "mentions = [x for x in mentions if not pd.isna(x)]\n",
- "\n",
- "# split items into a list based on a delimiter\n",
- "mentions = [x.split(',') for x in mentions]\n",
- "\n",
- "# flatten list of lists\n",
- "mentions = [item for sublist in mentions for item in sublist]\n",
- "\n",
- "# remove whitespaces\n",
- "mentions = list(map(lambda x: x.replace(' ', ''), mentions))\n",
- "\n",
- "# count items on list\n",
- "mentions_count = pd.Series(mentions).value_counts()\n",
- "\n",
- "# return first n rows in descending order\n",
- "top_mentions = mentions_count.nlargest(20)\n",
- "\n",
- "top_mentions"
+ "filtered_df.to_csv('../data/raw/datos_etiquetados.csv', index=False)"
]
}
],
diff --git a/_notebooks/1.1-analyze.ipynb b/_notebooks/1.1-analyze.ipynb
index faad733..0ab4215 100644
--- a/_notebooks/1.1-analyze.ipynb
+++ b/_notebooks/1.1-analyze.ipynb
@@ -2,157 +2,1510 @@
"cells": [
{
"cell_type": "code",
- "execution_count": 1,
+ "execution_count": 21,
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd\n",
- "import nltk\n",
- "from nltk.collocations import BigramCollocationFinder\n",
- "from nltk.metrics import BigramAssocMeasures\n",
- "from nltk.collocations import TrigramCollocationFinder\n",
- "from nltk.metrics import TrigramAssocMeasures"
+ "import numpy as np\n",
+ "import re"
]
},
{
"cell_type": "code",
- "execution_count": 2,
+ "execution_count": 22,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
- "(55374, 22)\n"
+ "52476\n"
]
+ },
+ {
+ "data": {
+ "text/html": [
+ "
\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " is_rt | \n",
+ " rt_by | \n",
+ " raw | \n",
+ " query_type | \n",
+ " scraped_at | \n",
+ " event | \n",
+ " date_cleansed | \n",
+ " date_local | \n",
+ " dt_date | \n",
+ " label | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 0 | \n",
+ " 1708973726455181497 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17089737264... | \n",
+ " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T22:34:22+00:00 | \n",
+ " 0 | \n",
+ " 3 | \n",
+ " 17 | \n",
+ " ... | \n",
+ " False | \n",
+ " NaN | \n",
+ " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
+ " from: @soyingridbeck | \n",
+ " 2023-10-10T17:43:36.448550+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 22:34:22+00:00 | \n",
+ " 2023-10-02 19:34:22-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ "
\n",
+ " \n",
+ " 1 | \n",
+ " 1708809681924243938 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17088096819... | \n",
+ " ¿Irse a Marbella en un yate de lujo? | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:42:30+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " ... | \n",
+ " False | \n",
+ " NaN | \n",
+ " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
+ " from: @soyingridbeck | \n",
+ " 2023-10-10T17:43:36.612322+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 11:42:30+00:00 | \n",
+ " 2023-10-02 08:42:30-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ "
\n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " False | \n",
+ " NaN | \n",
+ " {'html_tweet': 'Karina Galperin@kgalperin·Oct ... | \n",
+ " to: @soyingridbeck | \n",
+ " 2023-10-10T18:22:43.429345+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 11:46:58+00:00 | \n",
+ " 2023-10-02 08:46:58-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 23 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "0 1708973726455181497 @soyingridbeck \n",
+ "1 1708809681924243938 @soyingridbeck \n",
+ "2 1708810804101853498 @kgalperin \n",
+ "\n",
+ " url \\\n",
+ "0 https://x.com/soyingridbeck/status/17089737264... \n",
+ "1 https://x.com/soyingridbeck/status/17088096819... \n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "\n",
+ " text image video \\\n",
+ "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
+ "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
+ "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
+ "\n",
+ " date reply retweet like ... is_rt rt_by \\\n",
+ "0 2023-10-02T22:34:22+00:00 0 3 17 ... False NaN \n",
+ "1 2023-10-02T11:42:30+00:00 1 0 0 ... False NaN \n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... False NaN \n",
+ "\n",
+ " raw query_type \\\n",
+ "0 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
+ "1 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
+ "2 {'html_tweet': 'Karina Galperin@kgalperin·Oct ... to: @soyingridbeck \n",
+ "\n",
+ " scraped_at event date_cleansed \\\n",
+ "0 2023-10-10T17:43:36.448550+00:00 1er debate 2023-10-02 22:34:22+00:00 \n",
+ "1 2023-10-10T17:43:36.612322+00:00 1er debate 2023-10-02 11:42:30+00:00 \n",
+ "2 2023-10-10T18:22:43.429345+00:00 1er debate 2023-10-02 11:46:58+00:00 \n",
+ "\n",
+ " date_local dt_date label \n",
+ "0 2023-10-02 19:34:22-03:00 2023-10-02 [] \n",
+ "1 2023-10-02 08:42:30-03:00 2023-10-02 [] \n",
+ "2 2023-10-02 08:46:58-03:00 2023-10-02 [] \n",
+ "\n",
+ "[3 rows x 23 columns]"
+ ]
+ },
+ "execution_count": 22,
+ "metadata": {},
+ "output_type": "execute_result"
}
],
"source": [
- "# Read the DataFrame with the tweet text\n",
- "df = pd.read_csv(\"../data/raw/elecciones_argentina.csv\")\n",
- "print(df.shape)"
+ "df = pd.read_csv('../data/raw/datos_etiquetados.csv')\n",
+ "print(len(df))\n",
+ "df.head(3)"
]
},
{
"cell_type": "code",
- "execution_count": 3,
+ "execution_count": 23,
"metadata": {},
- "outputs": [],
+ "outputs": [
+ {
+ "data": {
+ "text/html": [
+ "\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " rt_by | \n",
+ " raw | \n",
+ " query_type | \n",
+ " scraped_at | \n",
+ " event | \n",
+ " date_cleansed | \n",
+ " date_local | \n",
+ " dt_date | \n",
+ " label | \n",
+ " journalist_username | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 0 | \n",
+ " 1708973726455181497 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17089737264... | \n",
+ " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T22:34:22+00:00 | \n",
+ " 0 | \n",
+ " 3 | \n",
+ " 17 | \n",
+ " ... | \n",
+ " NaN | \n",
+ " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
+ " from: @soyingridbeck | \n",
+ " 2023-10-10T17:43:36.448550+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 22:34:22+00:00 | \n",
+ " 2023-10-02 19:34:22-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ " @soyingridbeck | \n",
+ "
\n",
+ " \n",
+ " 1 | \n",
+ " 1708809681924243938 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17088096819... | \n",
+ " ¿Irse a Marbella en un yate de lujo? | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:42:30+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " ... | \n",
+ " NaN | \n",
+ " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
+ " from: @soyingridbeck | \n",
+ " 2023-10-10T17:43:36.612322+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 11:42:30+00:00 | \n",
+ " 2023-10-02 08:42:30-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ " @soyingridbeck | \n",
+ "
\n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " NaN | \n",
+ " {'html_tweet': 'Karina Galperin@kgalperin·Oct ... | \n",
+ " to: @soyingridbeck | \n",
+ " 2023-10-10T18:22:43.429345+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 11:46:58+00:00 | \n",
+ " 2023-10-02 08:46:58-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ " @soyingridbeck | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 24 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "0 1708973726455181497 @soyingridbeck \n",
+ "1 1708809681924243938 @soyingridbeck \n",
+ "2 1708810804101853498 @kgalperin \n",
+ "\n",
+ " url \\\n",
+ "0 https://x.com/soyingridbeck/status/17089737264... \n",
+ "1 https://x.com/soyingridbeck/status/17088096819... \n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "\n",
+ " text image video \\\n",
+ "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
+ "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
+ "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
+ "\n",
+ " date reply retweet like ... rt_by \\\n",
+ "0 2023-10-02T22:34:22+00:00 0 3 17 ... NaN \n",
+ "1 2023-10-02T11:42:30+00:00 1 0 0 ... NaN \n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... NaN \n",
+ "\n",
+ " raw query_type \\\n",
+ "0 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
+ "1 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
+ "2 {'html_tweet': 'Karina Galperin@kgalperin·Oct ... to: @soyingridbeck \n",
+ "\n",
+ " scraped_at event date_cleansed \\\n",
+ "0 2023-10-10T17:43:36.448550+00:00 1er debate 2023-10-02 22:34:22+00:00 \n",
+ "1 2023-10-10T17:43:36.612322+00:00 1er debate 2023-10-02 11:42:30+00:00 \n",
+ "2 2023-10-10T18:22:43.429345+00:00 1er debate 2023-10-02 11:46:58+00:00 \n",
+ "\n",
+ " date_local dt_date label journalist_username \n",
+ "0 2023-10-02 19:34:22-03:00 2023-10-02 [] @soyingridbeck \n",
+ "1 2023-10-02 08:42:30-03:00 2023-10-02 [] @soyingridbeck \n",
+ "2 2023-10-02 08:46:58-03:00 2023-10-02 [] @soyingridbeck \n",
+ "\n",
+ "[3 rows x 24 columns]"
+ ]
+ },
+ "execution_count": 23,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
"source": [
- "# Tokenize the tweet text\n",
- "tokenizer = nltk.tokenize.RegexpTokenizer(r'\\w+')\n",
- "df['tokens'] = df['text'].apply(lambda x: tokenizer.tokenize(str(x).lower()))\n",
- "tokens = df['tokens']"
+ "df['journalist_username'] = df['query_type'].str.extract(r'(@\\w+)')\n",
+ "df.head(3)\n"
]
},
{
"cell_type": "code",
- "execution_count": 4,
+ "execution_count": 24,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
- "('de', 'periodista') 62\n",
- "('sos', 'periodista') 54\n",
- "('periodista', 'de') 49\n",
- "('un', 'periodista') 47\n",
- "('periodista', 'independiente') 45\n",
- "('el', 'periodista') 43\n",
- "('como', 'periodista') 40\n",
- "('periodista', 'que') 33\n",
- "('la', 'periodista') 30\n",
- "('periodista', 'y') 28\n",
- "('una', 'periodista') 22\n",
- "('periodista', 'sos') 21\n",
- "('es', 'periodista') 20\n",
- "('gran', 'periodista') 17\n",
- "('periodista', 'no') 13\n",
- "('ser', 'periodista') 12\n",
- "('periodista', 'militante') 12\n",
- "('mejor', 'periodista') 11\n",
- "('periodista', 'crítico') 11\n",
- "('periodista', 'pero') 10\n"
+ "Mujeres periodistas: 34\n",
+ "Hombres periodistas: 20\n"
]
+ },
+ {
+ "data": {
+ "text/html": [
+ "\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " raw | \n",
+ " query_type | \n",
+ " scraped_at | \n",
+ " event | \n",
+ " date_cleansed | \n",
+ " date_local | \n",
+ " dt_date | \n",
+ " label | \n",
+ " journalist_username | \n",
+ " journalist_genre | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 0 | \n",
+ " 1708973726455181497 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17089737264... | \n",
+ " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T22:34:22+00:00 | \n",
+ " 0 | \n",
+ " 3 | \n",
+ " 17 | \n",
+ " ... | \n",
+ " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
+ " from: @soyingridbeck | \n",
+ " 2023-10-10T17:43:36.448550+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 22:34:22+00:00 | \n",
+ " 2023-10-02 19:34:22-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ " @soyingridbeck | \n",
+ " M | \n",
+ "
\n",
+ " \n",
+ " 1 | \n",
+ " 1708809681924243938 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17088096819... | \n",
+ " ¿Irse a Marbella en un yate de lujo? | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:42:30+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " ... | \n",
+ " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
+ " from: @soyingridbeck | \n",
+ " 2023-10-10T17:43:36.612322+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 11:42:30+00:00 | \n",
+ " 2023-10-02 08:42:30-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ " @soyingridbeck | \n",
+ " M | \n",
+ "
\n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " {'html_tweet': 'Karina Galperin@kgalperin·Oct ... | \n",
+ " to: @soyingridbeck | \n",
+ " 2023-10-10T18:22:43.429345+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 11:46:58+00:00 | \n",
+ " 2023-10-02 08:46:58-03:00 | \n",
+ " 2023-10-02 | \n",
+ " [] | \n",
+ " @soyingridbeck | \n",
+ " M | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 25 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "0 1708973726455181497 @soyingridbeck \n",
+ "1 1708809681924243938 @soyingridbeck \n",
+ "2 1708810804101853498 @kgalperin \n",
+ "\n",
+ " url \\\n",
+ "0 https://x.com/soyingridbeck/status/17089737264... \n",
+ "1 https://x.com/soyingridbeck/status/17088096819... \n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "\n",
+ " text image video \\\n",
+ "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
+ "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
+ "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
+ "\n",
+ " date reply retweet like ... \\\n",
+ "0 2023-10-02T22:34:22+00:00 0 3 17 ... \n",
+ "1 2023-10-02T11:42:30+00:00 1 0 0 ... \n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... \n",
+ "\n",
+ " raw query_type \\\n",
+ "0 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
+ "1 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
+ "2 {'html_tweet': 'Karina Galperin@kgalperin·Oct ... to: @soyingridbeck \n",
+ "\n",
+ " scraped_at event date_cleansed \\\n",
+ "0 2023-10-10T17:43:36.448550+00:00 1er debate 2023-10-02 22:34:22+00:00 \n",
+ "1 2023-10-10T17:43:36.612322+00:00 1er debate 2023-10-02 11:42:30+00:00 \n",
+ "2 2023-10-10T18:22:43.429345+00:00 1er debate 2023-10-02 11:46:58+00:00 \n",
+ "\n",
+ " date_local dt_date label journalist_username \\\n",
+ "0 2023-10-02 19:34:22-03:00 2023-10-02 [] @soyingridbeck \n",
+ "1 2023-10-02 08:42:30-03:00 2023-10-02 [] @soyingridbeck \n",
+ "2 2023-10-02 08:46:58-03:00 2023-10-02 [] @soyingridbeck \n",
+ "\n",
+ " journalist_genre \n",
+ "0 M \n",
+ "1 M \n",
+ "2 M \n",
+ "\n",
+ "[3 rows x 25 columns]"
+ ]
+ },
+ "execution_count": 24,
+ "metadata": {},
+ "output_type": "execute_result"
}
],
"source": [
- "# Find collocations with 'periodista' for each tweet\n",
- "collocations = []\n",
- "for tweet_tokens in tokens:\n",
- " finder = BigramCollocationFinder.from_words(tweet_tokens)\n",
- " tweet_collocations = finder.nbest(BigramAssocMeasures().raw_freq, 20)\n",
- " collocations.extend(tweet_collocations)\n",
- "\n",
- "# Filter collocations that contain 'periodista'\n",
- "periodista_collocations = [col for col in collocations if 'periodista' in col]\n",
- "\n",
- "# Count the occurrences of each collocation\n",
- "collocation_counts = nltk.FreqDist(periodista_collocations)\n",
- "\n",
- "# Print the collocations and their counts\n",
- "for collocation, count in collocation_counts.most_common(20):\n",
- " print(collocation, count)\n"
+ "mujeres = ['@Miglesias71', '@gabipellegrini3', '@GabrielaWeller',\n",
+ " '@SanchezClarise', '@soyingridbeck', '@SilvinaMolina',\n",
+ " '@mafito11', '@AJuliaLopez', '@Cris_noticias',\n",
+ " '@vivicanosaok', '@marialauratv', '@guadavazquez',\n",
+ " '@odonnellmaria', '@mjolivan', '@maclorena',\n",
+ " '@rominamanguel', '@monigps', '@lucianageuna',\n",
+ " '@negropolisok', '@juliamengo', '@FlorHalfon',\n",
+ " '@cyngarciaradio', '@deboraplager', '@silviafbarrio',\n",
+ " '@NANCYPAZOS', '@gabycociffi', '@SoleVallejos',\n",
+ " '@nbg__', '@hindelita', '@MercedesFunes',\n",
+ " '@anaecorrea', '@Marcelitaojeda', '@lucianapeker',\n",
+ " '@Angelalerena']\n",
+ "\n",
+ "hombres = ['@rialjorge', '@fantinofantino', '@andykusnetzoff',\n",
+ " '@SANTIAGODELMORO', '@VHMok', '@wwnicolas',\n",
+ " '@edufeiok', '@luisnovaresio', '@JonatanViale',\n",
+ " '@majulluis', '@barilirodolfo', '@diegoleuco',\n",
+ " '@alfleuco', '@Gatosylvestre', '@robdnavarro',\n",
+ " '@Sietecase', '@aleberco', '@diegobranca',\n",
+ " '@ischargro', '@ertenembaum']\n",
+ "\n",
+ "print(f'Mujeres periodistas: {len(mujeres)}\\nHombres periodistas: {len(hombres)}')\n",
+ "\n",
+ "# Check if any element from the lists is present in the 'query_type' column\n",
+ "df['journalist_genre'] = ''\n",
+ "df.loc[df['query_type'].str.contains('|'.join(mujeres)), 'journalist_genre'] = 'M'\n",
+ "df.loc[df['query_type'].str.contains('|'.join(hombres)), 'journalist_genre'] = 'H'\n",
+ "\n",
+ "df.head(3)"
]
},
{
"cell_type": "code",
- "execution_count": 5,
+ "execution_count": 25,
"metadata": {},
"outputs": [
{
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "('no', 'sos', 'periodista') 16\n",
- "('a', 'un', 'periodista') 12\n",
- "('vos', 'sos', 'periodista') 12\n",
- "('periodista', 'de', 'verdad') 11\n",
- "('un', 'periodista', 'de') 9\n",
- "('que', 'sos', 'periodista') 8\n",
- "('sos', 'un', 'periodista') 8\n",
- "('no', 'es', 'periodista') 7\n",
- "('la', 'periodista', 'que') 7\n",
- "('a', 'una', 'periodista') 7\n",
- "('sos', 'periodista', 'sos') 7\n",
- "('que', 'seas', 'periodista') 6\n",
- "('un', 'gran', 'periodista') 6\n",
- "('de', 'ser', 'periodista') 6\n",
- "('periodista', 'sos', 'un') 6\n",
- "('sos', 'una', 'periodista') 6\n",
- "('es', 'periodista', 'es') 5\n",
- "('un', 'periodista', 'independiente') 5\n",
- "('de', 'un', 'periodista') 5\n",
- "('la', 'periodista', 'independiente') 5\n"
- ]
+ "data": {
+ "text/html": [
+ "\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " raw | \n",
+ " query_type | \n",
+ " scraped_at | \n",
+ " event | \n",
+ " date_cleansed | \n",
+ " date_local | \n",
+ " dt_date | \n",
+ " label | \n",
+ " journalist_username | \n",
+ " journalist_genre | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 0 | \n",
+ " 1708973726455181497 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17089737264... | \n",
+ " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T22:34:22+00:00 | \n",
+ " 0 | \n",
+ " 3 | \n",
+ " 17 | \n",
+ " ... | \n",
+ " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
+ " from: @soyingridbeck | \n",
+ " 2023-10-10T17:43:36.448550+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 22:34:22+00:00 | \n",
+ " 2023-10-02 19:34:22-03:00 | \n",
+ " 2023-10-02 | \n",
+ " | \n",
+ " @soyingridbeck | \n",
+ " M | \n",
+ "
\n",
+ " \n",
+ " 1 | \n",
+ " 1708809681924243938 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17088096819... | \n",
+ " ¿Irse a Marbella en un yate de lujo? | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:42:30+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " ... | \n",
+ " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
+ " from: @soyingridbeck | \n",
+ " 2023-10-10T17:43:36.612322+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 11:42:30+00:00 | \n",
+ " 2023-10-02 08:42:30-03:00 | \n",
+ " 2023-10-02 | \n",
+ " | \n",
+ " @soyingridbeck | \n",
+ " M | \n",
+ "
\n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " {'html_tweet': 'Karina Galperin@kgalperin·Oct ... | \n",
+ " to: @soyingridbeck | \n",
+ " 2023-10-10T18:22:43.429345+00:00 | \n",
+ " 1er debate | \n",
+ " 2023-10-02 11:46:58+00:00 | \n",
+ " 2023-10-02 08:46:58-03:00 | \n",
+ " 2023-10-02 | \n",
+ " | \n",
+ " @soyingridbeck | \n",
+ " M | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 25 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "0 1708973726455181497 @soyingridbeck \n",
+ "1 1708809681924243938 @soyingridbeck \n",
+ "2 1708810804101853498 @kgalperin \n",
+ "\n",
+ " url \\\n",
+ "0 https://x.com/soyingridbeck/status/17089737264... \n",
+ "1 https://x.com/soyingridbeck/status/17088096819... \n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "\n",
+ " text image video \\\n",
+ "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
+ "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
+ "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
+ "\n",
+ " date reply retweet like ... \\\n",
+ "0 2023-10-02T22:34:22+00:00 0 3 17 ... \n",
+ "1 2023-10-02T11:42:30+00:00 1 0 0 ... \n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... \n",
+ "\n",
+ " raw query_type \\\n",
+ "0 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
+ "1 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
+ "2 {'html_tweet': 'Karina Galperin@kgalperin·Oct ... to: @soyingridbeck \n",
+ "\n",
+ " scraped_at event date_cleansed \\\n",
+ "0 2023-10-10T17:43:36.448550+00:00 1er debate 2023-10-02 22:34:22+00:00 \n",
+ "1 2023-10-10T17:43:36.612322+00:00 1er debate 2023-10-02 11:42:30+00:00 \n",
+ "2 2023-10-10T18:22:43.429345+00:00 1er debate 2023-10-02 11:46:58+00:00 \n",
+ "\n",
+ " date_local dt_date label journalist_username \\\n",
+ "0 2023-10-02 19:34:22-03:00 2023-10-02 @soyingridbeck \n",
+ "1 2023-10-02 08:42:30-03:00 2023-10-02 @soyingridbeck \n",
+ "2 2023-10-02 08:46:58-03:00 2023-10-02 @soyingridbeck \n",
+ "\n",
+ " journalist_genre \n",
+ "0 M \n",
+ "1 M \n",
+ "2 M \n",
+ "\n",
+ "[3 rows x 25 columns]"
+ ]
+ },
+ "execution_count": 25,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "df['label'] = df['label'].replace(\"[]\", '')\n",
+ "\n",
+ "df.head(3)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 26,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ " 48581\n",
+ "WOMEN 1269\n",
+ "POLITICS 1155\n",
+ "APPEARANCE 1112\n",
+ "DISABLED 335\n",
+ "RACISM 214\n",
+ "CLASS 149\n",
+ "LGBTI 128\n",
+ "CRIMINAL 49\n",
+ "CALLS 45\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 26,
+ "metadata": {},
+ "output_type": "execute_result"
}
],
"source": [
- "# Find collocations with 'periodista' for each tweet and count them\n",
- "collocations = []\n",
- "for tweet_tokens in tokens:\n",
- " finder = TrigramCollocationFinder.from_words(tweet_tokens)\n",
- " tweet_collocations = finder.nbest(TrigramAssocMeasures().raw_freq, 20)\n",
- " collocations.extend(tweet_collocations)\n",
- "\n",
- "# Filter collocations that contain 'periodista'\n",
- "periodista_collocations = [col for col in collocations if 'periodista' in col]\n",
- "\n",
- "# Count the occurrences of each collocation\n",
- "collocation_counts = nltk.FreqDist(periodista_collocations)\n",
- "\n",
- "# Print the collocations and their counts\n",
- "for collocation, count in collocation_counts.most_common(20):\n",
- " print(collocation, count)\n"
+ "df['label'] = df['label'].str.replace(\"[\\'\\[\\]]\", '', regex=True)\n",
+ "\n",
+ "labels = df['label'].to_list()\n",
+ "\n",
+ "labels = [x.split(',') for x in labels]\n",
+ "\n",
+ "labels = [item for sublist in labels for item in sublist]\n",
+ "\n",
+ "labels = [x.lstrip() for x in labels]\n",
+ "\n",
+ "labels_count = pd.Series(labels).value_counts()\n",
+ "\n",
+ "labels_count"
]
},
{
"cell_type": "code",
- "execution_count": null,
+ "execution_count": 27,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/html": [
+ "\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " journalist_genre | \n",
+ " women | \n",
+ " politics | \n",
+ " appearance | \n",
+ " disabled | \n",
+ " racism | \n",
+ " class | \n",
+ " lgbti | \n",
+ " criminal | \n",
+ " calls | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 0 | \n",
+ " 1708973726455181497 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17089737264... | \n",
+ " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T22:34:22+00:00 | \n",
+ " 0 | \n",
+ " 3 | \n",
+ " 17 | \n",
+ " ... | \n",
+ " M | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ "
\n",
+ " \n",
+ " 1 | \n",
+ " 1708809681924243938 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17088096819... | \n",
+ " ¿Irse a Marbella en un yate de lujo? | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:42:30+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " ... | \n",
+ " M | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ "
\n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " M | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 34 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "0 1708973726455181497 @soyingridbeck \n",
+ "1 1708809681924243938 @soyingridbeck \n",
+ "2 1708810804101853498 @kgalperin \n",
+ "\n",
+ " url \\\n",
+ "0 https://x.com/soyingridbeck/status/17089737264... \n",
+ "1 https://x.com/soyingridbeck/status/17088096819... \n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "\n",
+ " text image video \\\n",
+ "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
+ "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
+ "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
+ "\n",
+ " date reply retweet like ... journalist_genre \\\n",
+ "0 2023-10-02T22:34:22+00:00 0 3 17 ... M \n",
+ "1 2023-10-02T11:42:30+00:00 1 0 0 ... M \n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... M \n",
+ "\n",
+ " women politics appearance disabled racism class lgbti criminal calls \n",
+ "0 0 0 0 0 0 0 0 0 0 \n",
+ "1 0 0 0 0 0 0 0 0 0 \n",
+ "2 0 0 0 0 0 0 0 0 0 \n",
+ "\n",
+ "[3 rows x 34 columns]"
+ ]
+ },
+ "execution_count": 27,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "labels = ['women', 'politics', 'appearance', 'disabled', 'racism', 'class', 'lgbti', 'criminal', 'calls']\n",
+ "\n",
+ "for label in labels:\n",
+ " df[label] = df['label'].str.contains(label, case=False).astype(int)\n",
+ "\n",
+ "df.head(3)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 28,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/html": [
+ "\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " women | \n",
+ " politics | \n",
+ " appearance | \n",
+ " disabled | \n",
+ " racism | \n",
+ " class | \n",
+ " lgbti | \n",
+ " criminal | \n",
+ " calls | \n",
+ " to_journalist | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 0 | \n",
+ " 1708973726455181497 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17089737264... | \n",
+ " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T22:34:22+00:00 | \n",
+ " 0 | \n",
+ " 3 | \n",
+ " 17 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " NaN | \n",
+ "
\n",
+ " \n",
+ " 1 | \n",
+ " 1708809681924243938 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17088096819... | \n",
+ " ¿Irse a Marbella en un yate de lujo? | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:42:30+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " NaN | \n",
+ "
\n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " @soyingridbeck | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 35 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "0 1708973726455181497 @soyingridbeck \n",
+ "1 1708809681924243938 @soyingridbeck \n",
+ "2 1708810804101853498 @kgalperin \n",
+ "\n",
+ " url \\\n",
+ "0 https://x.com/soyingridbeck/status/17089737264... \n",
+ "1 https://x.com/soyingridbeck/status/17088096819... \n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "\n",
+ " text image video \\\n",
+ "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
+ "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
+ "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
+ "\n",
+ " date reply retweet like ... women politics \\\n",
+ "0 2023-10-02T22:34:22+00:00 0 3 17 ... 0 0 \n",
+ "1 2023-10-02T11:42:30+00:00 1 0 0 ... 0 0 \n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... 0 0 \n",
+ "\n",
+ " appearance disabled racism class lgbti criminal calls to_journalist \n",
+ "0 0 0 0 0 0 0 0 NaN \n",
+ "1 0 0 0 0 0 0 0 NaN \n",
+ "2 0 0 0 0 0 0 0 @soyingridbeck \n",
+ "\n",
+ "[3 rows x 35 columns]"
+ ]
+ },
+ "execution_count": 28,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "df['to_journalist'] = df['query_type'].str.extract(r'(?<=to:\\s)(@\\w+)', flags=re.IGNORECASE).fillna(np.nan)\n",
+ "\n",
+ "df.head(3)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 29,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/html": [
+ "\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " politics | \n",
+ " appearance | \n",
+ " disabled | \n",
+ " racism | \n",
+ " class | \n",
+ " lgbti | \n",
+ " criminal | \n",
+ " calls | \n",
+ " to_journalist | \n",
+ " from_journalist | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 0 | \n",
+ " 1708973726455181497 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17089737264... | \n",
+ " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T22:34:22+00:00 | \n",
+ " 0 | \n",
+ " 3 | \n",
+ " 17 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " NaN | \n",
+ " @soyingridbeck | \n",
+ "
\n",
+ " \n",
+ " 1 | \n",
+ " 1708809681924243938 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17088096819... | \n",
+ " ¿Irse a Marbella en un yate de lujo? | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:42:30+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " NaN | \n",
+ " @soyingridbeck | \n",
+ "
\n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " @soyingridbeck | \n",
+ " NaN | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 36 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "0 1708973726455181497 @soyingridbeck \n",
+ "1 1708809681924243938 @soyingridbeck \n",
+ "2 1708810804101853498 @kgalperin \n",
+ "\n",
+ " url \\\n",
+ "0 https://x.com/soyingridbeck/status/17089737264... \n",
+ "1 https://x.com/soyingridbeck/status/17088096819... \n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "\n",
+ " text image video \\\n",
+ "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
+ "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
+ "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
+ "\n",
+ " date reply retweet like ... politics appearance \\\n",
+ "0 2023-10-02T22:34:22+00:00 0 3 17 ... 0 0 \n",
+ "1 2023-10-02T11:42:30+00:00 1 0 0 ... 0 0 \n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... 0 0 \n",
+ "\n",
+ " disabled racism class lgbti criminal calls to_journalist \\\n",
+ "0 0 0 0 0 0 0 NaN \n",
+ "1 0 0 0 0 0 0 NaN \n",
+ "2 0 0 0 0 0 0 @soyingridbeck \n",
+ "\n",
+ " from_journalist \n",
+ "0 @soyingridbeck \n",
+ "1 @soyingridbeck \n",
+ "2 NaN \n",
+ "\n",
+ "[3 rows x 36 columns]"
+ ]
+ },
+ "execution_count": 29,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "df['from_journalist'] = df['query_type'].str.extract(r'(?<=from:\\s)(@\\w+)', flags=re.IGNORECASE).fillna(np.nan)\n",
+ "\n",
+ "df.head(3)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 30,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/html": [
+ "\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " politics | \n",
+ " appearance | \n",
+ " disabled | \n",
+ " racism | \n",
+ " class | \n",
+ " lgbti | \n",
+ " criminal | \n",
+ " calls | \n",
+ " to_journalist | \n",
+ " from_journalist | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " @soyingridbeck | \n",
+ " NaN | \n",
+ "
\n",
+ " \n",
+ " 4 | \n",
+ " 1708668473595810243 | \n",
+ " @malepichot | \n",
+ " https://x.com/malepichot/status/17086684735958... | \n",
+ " Re! | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T02:21:24+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 12 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " @soyingridbeck | \n",
+ " NaN | \n",
+ "
\n",
+ " \n",
+ " 5 | \n",
+ " 1708679515679924447 | \n",
+ " @Krizthi33880599 | \n",
+ " https://x.com/Krizthi33880599/status/170867951... | \n",
+ " @malepichot defendiendo a la socialista de Mir... | \n",
+ " https://pbs.twimg.com/media/F7Zy9sQW8AA8lpb?fo... | \n",
+ " NaN | \n",
+ " 2023-10-02T03:05:16+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " @soyingridbeck | \n",
+ " NaN | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 36 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "2 1708810804101853498 @kgalperin \n",
+ "4 1708668473595810243 @malepichot \n",
+ "5 1708679515679924447 @Krizthi33880599 \n",
+ "\n",
+ " url \\\n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "4 https://x.com/malepichot/status/17086684735958... \n",
+ "5 https://x.com/Krizthi33880599/status/170867951... \n",
+ "\n",
+ " text \\\n",
+ "2 Me asombra esa interpretación, q expresa muy b... \n",
+ "4 Re! \n",
+ "5 @malepichot defendiendo a la socialista de Mir... \n",
+ "\n",
+ " image video \\\n",
+ "2 NaN NaN \n",
+ "4 NaN NaN \n",
+ "5 https://pbs.twimg.com/media/F7Zy9sQW8AA8lpb?fo... NaN \n",
+ "\n",
+ " date reply retweet like ... politics appearance \\\n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... 0 0 \n",
+ "4 2023-10-02T02:21:24+00:00 1 0 12 ... 0 0 \n",
+ "5 2023-10-02T03:05:16+00:00 0 0 1 ... 0 0 \n",
+ "\n",
+ " disabled racism class lgbti criminal calls to_journalist \\\n",
+ "2 0 0 0 0 0 0 @soyingridbeck \n",
+ "4 0 0 0 0 0 0 @soyingridbeck \n",
+ "5 0 0 0 0 0 0 @soyingridbeck \n",
+ "\n",
+ " from_journalist \n",
+ "2 NaN \n",
+ "4 NaN \n",
+ "5 NaN \n",
+ "\n",
+ "[3 rows x 36 columns]"
+ ]
+ },
+ "execution_count": 30,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "attacks = df.dropna(subset=['label', 'to_journalist'])\n",
+ "\n",
+ "attacks.head(3)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 31,
"metadata": {},
"outputs": [],
- "source": []
+ "source": [
+ "df.to_csv('../data/processed/elecciones_argentina.csv', index=False)\n",
+ "attacks.to_excel('../data/processed/ataques_elecciones_argentina.xlsx', index=False, sheet_name='data')"
+ ]
}
],
"metadata": {
@@ -171,7 +1524,7 @@
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
- "version": "3.11.4"
+ "version": "3.11.7"
}
},
"nbformat": 4,
diff --git a/_notebooks/1.2-analyze.ipynb b/_notebooks/1.2-analyze.ipynb
index f01e44c..abbc663 100644
--- a/_notebooks/1.2-analyze.ipynb
+++ b/_notebooks/1.2-analyze.ipynb
@@ -2,142 +2,1126 @@
"cells": [
{
"cell_type": "code",
- "execution_count": 26,
+ "execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd\n",
- "import numpy as np\n",
- "from tqdm import tqdm\n",
- "import torch\n",
- "from transformers import AutoTokenizer, AutoModelForSequenceClassification"
+ "import numpy as np"
]
},
{
"cell_type": "code",
- "execution_count": 27,
+ "execution_count": 2,
"metadata": {},
"outputs": [
{
- "name": "stderr",
- "output_type": "stream",
- "text": [
- "Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.\n"
- ]
+ "data": {
+ "text/html": [
+ "\n",
+ "\n",
+ "
\n",
+ " \n",
+ " \n",
+ " | \n",
+ " tweet_id | \n",
+ " username | \n",
+ " url | \n",
+ " text | \n",
+ " image | \n",
+ " video | \n",
+ " date | \n",
+ " reply | \n",
+ " retweet | \n",
+ " like | \n",
+ " ... | \n",
+ " journalist_genre | \n",
+ " women | \n",
+ " politics | \n",
+ " appearance | \n",
+ " disabled | \n",
+ " racism | \n",
+ " class | \n",
+ " lgbti | \n",
+ " criminal | \n",
+ " calls | \n",
+ "
\n",
+ " \n",
+ " \n",
+ " \n",
+ " 0 | \n",
+ " 1708973726455181497 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17089737264... | \n",
+ " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T22:34:22+00:00 | \n",
+ " 0 | \n",
+ " 3 | \n",
+ " 17 | \n",
+ " ... | \n",
+ " M | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ "
\n",
+ " \n",
+ " 1 | \n",
+ " 1708809681924243938 | \n",
+ " @soyingridbeck | \n",
+ " https://x.com/soyingridbeck/status/17088096819... | \n",
+ " ¿Irse a Marbella en un yate de lujo? | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:42:30+00:00 | \n",
+ " 1 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " ... | \n",
+ " M | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ "
\n",
+ " \n",
+ " 2 | \n",
+ " 1708810804101853498 | \n",
+ " @kgalperin | \n",
+ " https://x.com/kgalperin/status/170881080410185... | \n",
+ " Me asombra esa interpretación, q expresa muy b... | \n",
+ " NaN | \n",
+ " NaN | \n",
+ " 2023-10-02T11:46:58+00:00 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 1 | \n",
+ " ... | \n",
+ " M | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ " 0 | \n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
3 rows × 34 columns
\n",
+ "
"
+ ],
+ "text/plain": [
+ " tweet_id username \\\n",
+ "0 1708973726455181497 @soyingridbeck \n",
+ "1 1708809681924243938 @soyingridbeck \n",
+ "2 1708810804101853498 @kgalperin \n",
+ "\n",
+ " url \\\n",
+ "0 https://x.com/soyingridbeck/status/17089737264... \n",
+ "1 https://x.com/soyingridbeck/status/17088096819... \n",
+ "2 https://x.com/kgalperin/status/170881080410185... \n",
+ "\n",
+ " text image video \\\n",
+ "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
+ "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
+ "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
+ "\n",
+ " date reply retweet like ... journalist_genre \\\n",
+ "0 2023-10-02T22:34:22+00:00 0 3 17 ... M \n",
+ "1 2023-10-02T11:42:30+00:00 1 0 0 ... M \n",
+ "2 2023-10-02T11:46:58+00:00 0 0 1 ... M \n",
+ "\n",
+ " women politics appearance disabled racism class lgbti criminal calls \n",
+ "0 0 0 0 0 0 0 0 0 0 \n",
+ "1 0 0 0 0 0 0 0 0 0 \n",
+ "2 0 0 0 0 0 0 0 0 0 \n",
+ "\n",
+ "[3 rows x 34 columns]"
+ ]
+ },
+ "execution_count": 2,
+ "metadata": {},
+ "output_type": "execute_result"
}
],
"source": [
- "model_name = \"piubamas/beto-contextualized-hate-speech\"\n",
- "# Load tokenizer and model\n",
- "tokenizer = AutoTokenizer.from_pretrained(model_name)\n",
- "model = AutoModelForSequenceClassification.from_pretrained(model_name)"
+ "df = pd.read_csv('../data/processed/elecciones_argentina.csv')\n",
+ "df.head(3)"
]
},
{
"cell_type": "code",
- "execution_count": 30,
+ "execution_count": 11,
"metadata": {},
"outputs": [
{
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "55374\n"
- ]
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@Angelalerena 169\n",
+ "@Cris_noticias 128\n",
+ "@odonnellmaria 107\n",
+ "@JonatanViale 101\n",
+ "@edufeiok 100\n",
+ "@vivicanosaok 81\n",
+ "@guadavazquez 66\n",
+ "@diegobranca 66\n",
+ "@rialjorge 66\n",
+ "@NANCYPAZOS 49\n",
+ "@Gatosylvestre 35\n",
+ "@robdnavarro 31\n",
+ "@luisnovaresio 29\n",
+ "@fantinofantino 26\n",
+ "@rominamanguel 25\n",
+ "@cyngarciaradio 24\n",
+ "@majulluis 21\n",
+ "@marialauratv 21\n",
+ "@mjolivan 19\n",
+ "@lucianageuna 19\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 11,
+ "metadata": {},
+ "output_type": "execute_result"
}
],
"source": [
- "df = pd.read_csv('../data/raw/elecciones_argentina.csv')\n",
+ "women_df = df[df['women'] == 1]\n",
"\n",
- "print(len(df))"
+ "women_df['journalist_username'].value_counts().head(20)"
]
},
{
"cell_type": "code",
- "execution_count": 31,
+ "execution_count": 12,
"metadata": {},
"outputs": [
{
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "52476\n"
- ]
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@diegobranca 136\n",
+ "@odonnellmaria 114\n",
+ "@Angelalerena 113\n",
+ "@Cris_noticias 92\n",
+ "@edufeiok 91\n",
+ "@robdnavarro 80\n",
+ "@rialjorge 71\n",
+ "@luisnovaresio 65\n",
+ "@JonatanViale 54\n",
+ "@Gatosylvestre 37\n",
+ "@nbg__ 29\n",
+ "@cyngarciaradio 27\n",
+ "@vivicanosaok 26\n",
+ "@mjolivan 25\n",
+ "@majulluis 24\n",
+ "@guadavazquez 21\n",
+ "@lucianageuna 17\n",
+ "@NANCYPAZOS 16\n",
+ "@ischargro 16\n",
+ "@fantinofantino 14\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 12,
+ "metadata": {},
+ "output_type": "execute_result"
}
],
"source": [
- "filtered_df = df.dropna(subset=['text'])\n",
+ "politics_df = df[df['politics'] == 1]\n",
"\n",
- "print(len(filtered_df))"
+ "politics_df['journalist_username'].value_counts().head(20)"
]
},
{
"cell_type": "code",
- "execution_count": 32,
+ "execution_count": 13,
"metadata": {},
- "outputs": [],
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@JonatanViale 247\n",
+ "@diegobranca 213\n",
+ "@edufeiok 87\n",
+ "@rialjorge 82\n",
+ "@Angelalerena 58\n",
+ "@odonnellmaria 51\n",
+ "@robdnavarro 47\n",
+ "@Cris_noticias 45\n",
+ "@vivicanosaok 37\n",
+ "@majulluis 35\n",
+ "@luisnovaresio 22\n",
+ "@cyngarciaradio 22\n",
+ "@mjolivan 20\n",
+ "@guadavazquez 16\n",
+ "@fantinofantino 15\n",
+ "@Gatosylvestre 14\n",
+ "@lucianageuna 13\n",
+ "@nbg__ 10\n",
+ "@ischargro 10\n",
+ "@juliamengo 10\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 13,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
"source": [
- "id2label = [model.config.id2label[k] for k in range(len(model.config.id2label))]\n",
+ "appearance_df = df[df['appearance'] == 1]\n",
"\n",
- "def predict(*args):\n",
- " try:\n",
- " encoding = tokenizer.encode_plus(*args)\n",
+ "appearance_df['journalist_username'].value_counts().head(20)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 14,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@guadavazquez 48\n",
+ "@edufeiok 43\n",
+ "@rialjorge 29\n",
+ "@diegobranca 24\n",
+ "@JonatanViale 22\n",
+ "@vivicanosaok 19\n",
+ "@Cris_noticias 19\n",
+ "@odonnellmaria 17\n",
+ "@majulluis 17\n",
+ "@fantinofantino 12\n",
+ "@robdnavarro 11\n",
+ "@luisnovaresio 9\n",
+ "@rominamanguel 8\n",
+ "@Angelalerena 7\n",
+ "@ischargro 7\n",
+ "@juliamengo 5\n",
+ "@nbg__ 5\n",
+ "@cyngarciaradio 5\n",
+ "@marialauratv 4\n",
+ "@NANCYPAZOS 4\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 14,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "disabled_df = df[df['disabled'] == 1]\n",
"\n",
- " inputs = {\n",
- " k: torch.LongTensor(encoding[k]).reshape(1, -1) for k in {\"input_ids\", \"attention_mask\", \"token_type_ids\"}\n",
- " }\n",
+ "disabled_df['journalist_username'].value_counts().head(20)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 15,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@edufeiok 32\n",
+ "@rominamanguel 21\n",
+ "@JonatanViale 20\n",
+ "@diegobranca 19\n",
+ "@Cris_noticias 17\n",
+ "@robdnavarro 14\n",
+ "@rialjorge 11\n",
+ "@Angelalerena 10\n",
+ "@negropolisok 9\n",
+ "@luisnovaresio 9\n",
+ "@odonnellmaria 8\n",
+ "@Gatosylvestre 6\n",
+ "@guadavazquez 5\n",
+ "@anaecorrea 5\n",
+ "@vivicanosaok 4\n",
+ "@mjolivan 3\n",
+ "@ischargro 3\n",
+ "@andykusnetzoff 2\n",
+ "@fantinofantino 2\n",
+ "@juliamengo 2\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 15,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "racism_df = df[df['racism'] == 1]\n",
"\n",
- " output = model.forward(\n",
- " **inputs\n",
- " )\n",
+ "racism_df['journalist_username'].value_counts().head(20)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 17,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@diegobranca 26\n",
+ "@luisnovaresio 19\n",
+ "@edufeiok 13\n",
+ "@Angelalerena 8\n",
+ "@rialjorge 7\n",
+ "@robdnavarro 6\n",
+ "@Gatosylvestre 5\n",
+ "@guadavazquez 4\n",
+ "@fantinofantino 4\n",
+ "@majulluis 4\n",
+ "@JonatanViale 4\n",
+ "@cyngarciaradio 4\n",
+ "@Cris_noticias 3\n",
+ "@ischargro 3\n",
+ "@ertenembaum 3\n",
+ "@lucianageuna 2\n",
+ "@vivicanosaok 2\n",
+ "@aleberco 2\n",
+ "@NANCYPAZOS 2\n",
+ "@nbg__ 2\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 17,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "lgbti_df = df[df['lgbti'] == 1]\n",
+ "\n",
+ "lgbti_df['journalist_username'].value_counts().head(20)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 18,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@diegobranca 14\n",
+ "@JonatanViale 7\n",
+ "@edufeiok 6\n",
+ "@mjolivan 3\n",
+ "@Gatosylvestre 2\n",
+ "@Angelalerena 2\n",
+ "@majulluis 2\n",
+ "@cyngarciaradio 2\n",
+ "@robdnavarro 2\n",
+ "@NANCYPAZOS 2\n",
+ "@rominamanguel 1\n",
+ "@guadavazquez 1\n",
+ "@hindelita 1\n",
+ "@rialjorge 1\n",
+ "@fantinofantino 1\n",
+ "@luisnovaresio 1\n",
+ "@aleberco 1\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 18,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "criminal_df = df[df['criminal'] == 1]\n",
"\n",
- " chars = list(zip(id2label, list(output.logits[0].detach().cpu().numpy() > 0)))\n",
+ "criminal_df['journalist_username'].value_counts().head(20)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 19,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@edufeiok 6\n",
+ "@diegobranca 5\n",
+ "@robdnavarro 4\n",
+ "@majulluis 4\n",
+ "@rominamanguel 4\n",
+ "@JonatanViale 3\n",
+ "@guadavazquez 2\n",
+ "@rialjorge 2\n",
+ "@mjolivan 2\n",
+ "@fantinofantino 2\n",
+ "@Angelalerena 2\n",
+ "@luisnovaresio 2\n",
+ "@SANTIAGODELMORO 1\n",
+ "@SilvinaMolina 1\n",
+ "@NANCYPAZOS 1\n",
+ "@aleberco 1\n",
+ "@Cris_noticias 1\n",
+ "@negropolisok 1\n",
+ "@cyngarciaradio 1\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 19,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "calls_df = df[df['calls'] == 1]\n",
"\n",
- " return [char for char, pred in chars if pred]\n",
- " \n",
- " except Exception as e:\n",
- " # Handle the error appropriately\n",
- " print(\"An error occurred:\", str(e))\n",
- " return np.nan"
+ "calls_df['journalist_username'].value_counts().head(20)"
]
},
{
"cell_type": "code",
- "execution_count": 33,
+ "execution_count": 24,
"metadata": {},
"outputs": [
{
- "name": "stderr",
- "output_type": "stream",
- "text": [
- "100%|██████████| 52476/52476 [1:06:43<00:00, 13.11it/s]\n",
- "/tmp/ipykernel_13246/4286658429.py:8: SettingWithCopyWarning: \n",
- "A value is trying to be set on a copy of a slice from a DataFrame.\n",
- "Try using .loc[row_indexer,col_indexer] = value instead\n",
- "\n",
- "See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy\n",
- " filtered_df['label'] = outputs\n"
- ]
+ "data": {
+ "text/plain": [
+ "journalist_username\n",
+ "@diegobranca 447\n",
+ "@JonatanViale 425\n",
+ "@edufeiok 340\n",
+ "@Angelalerena 336\n",
+ "@Cris_noticias 276\n",
+ "@odonnellmaria 256\n",
+ "@rialjorge 245\n",
+ "@robdnavarro 182\n",
+ "@vivicanosaok 154\n",
+ "@guadavazquez 151\n",
+ "@luisnovaresio 140\n",
+ "@majulluis 96\n",
+ "@Gatosylvestre 92\n",
+ "@NANCYPAZOS 77\n",
+ "@cyngarciaradio 71\n",
+ "@fantinofantino 70\n",
+ "@rominamanguel 64\n",
+ "@mjolivan 64\n",
+ "@nbg__ 55\n",
+ "@lucianageuna 50\n",
+ "@ischargro 44\n",
+ "@marialauratv 40\n",
+ "@juliamengo 34\n",
+ "@aleberco 29\n",
+ "@anaecorrea 27\n",
+ "@ertenembaum 20\n",
+ "@VHMok 16\n",
+ "@barilirodolfo 14\n",
+ "@negropolisok 14\n",
+ "@diegoleuco 9\n",
+ "@hindelita 8\n",
+ "@Sietecase 8\n",
+ "@andykusnetzoff 6\n",
+ "@alfleuco 6\n",
+ "@wwnicolas 4\n",
+ "@MercedesFunes 4\n",
+ "@SANTIAGODELMORO 4\n",
+ "@deboraplager 4\n",
+ "@maclorena 4\n",
+ "@Marcelitaojeda 3\n",
+ "@soyingridbeck 3\n",
+ "@SilvinaMolina 1\n",
+ "@monigps 1\n",
+ "@FlorHalfon 1\n",
+ "Name: count, dtype: int64"
+ ]
+ },
+ "execution_count": 24,
+ "metadata": {},
+ "output_type": "execute_result"
}
],
"source": [
- "texts = filtered_df['text'].to_list()\n",
+ "attacks = df.dropna(subset=['label'])\n",
"\n",
- "outputs = []\n",
- "for text in tqdm(texts):\n",
- " output = predict(text)\n",
- " outputs.append(output)\n",
+ "attacks['journalist_username'].value_counts()\n",
"\n",
- "filtered_df['label'] = outputs"
+ "# Tomar en cuenta número de seguidores"
]
},
{
"cell_type": "code",
- "execution_count": 36,
+ "execution_count": 6,
"metadata": {},
- "outputs": [],
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "['Todos centros y premeditado, volvé con las notas a las vedetongas',\n",
+ " 'Que raro vos sacandole el jugo al puterio. Cuanto t va a durar el amor x el panqueque?',\n",
+ " 'Seguro, le chupas las medias',\n",
+ " 'Jorge pregúntale porq yo como monotributista clase A, no puedo cobrar el beneficio y la clerichi siendo mono tipo A está en Marbella y compra Rolex?',\n",
+ " 'Lo vas a mimar un rato',\n",
+ " 'Llevaste las rodilleras?',\n",
+ " 'Supongo habrás ejercitado la boca para esta tarde ya que le vas a chupar las medias en todo el reportaje',\n",
+ " 'Y a veces te enredas \\nSe hace la mala hasta q haya quien le acomode la mandíbula',\n",
+ " 'Cuando habla tu pseudo hija ,te tiembla el culo.',\n",
+ " 'Y vos con los cuernos',\n",
+ " 'No, vos lucido no sos solo sabe de puterios',\n",
+ " 'Chocolate, numerologa, gatitos y barquitos, eso es kirchnerismo',\n",
+ " 'Lindo gatito @SergioChouza ehhh?',\n",
+ " 'Mere presa entonces a la rolinga de la maira mendoza x tener ctas en Miami.. y a toda tu catarba de kukas políticos chorros y a lo mejor vos también, con alguien que tiene tus cuentas con otro nombre..el que te cree esta mal de la cabeza .',\n",
+ " 'Y lógico, si la gente evade impuesto, quien va a pagar las putas y los yates?',\n",
+ " 'Pobre va a tener que ir a visitar a @MalenaGalmarini a la carcel de mujeres.',\n",
+ " '@fantinofantino Clerici enloquece a los hombres pero no se dan cuenta que es una prostituta.Y Miriam te hizo dormir en la calle.Ahora hunde a Insaurralde.',\n",
+ " '¿No estabas engripada?',\n",
+ " 'Mírate lo poco que sos. Soberbio. Lleno de violines, culos flojos, dictadores, clonazepam, y psicoticos \\nAnda que te cambie los pañales Massa. \\nFracaso',\n",
+ " 'Se llama trabajar en el sector privado, capaz sos munipa y no sabes de esas cosas, bullrich lleva 40 años viviendo de los impuestos boludaso',\n",
+ " 'No tomes nada q se te lengua la traba....',\n",
+ " 'VIEJA GAGAAAAAAAA',\n",
+ " 'No entendés la temática de x. \\nNunca abogado, porque aunque lo fueras, no entendés derecho. \\nMeada la Mondiola Diana, la Hermana tarotista y todo la juntada de analfa',\n",
+ " 'Ojo con este peluquitas encubierto pato..',\n",
+ " 'Si, boludita... Si creer eso te pone feliz pensa lo que quieras. Ahora anda a cambiarte el pañal meado que tenes',\n",
+ " 'Que explique el monopolio de la habilitación de los Matafuegos en Caba que maneja su marido',\n",
+ " '@fantinofantino vos la hiciste conocida cuando en tu programa llevaban gatos',\n",
+ " 'Ojo con los tragos, que embole esta bruta hablando 2 horas creo que no llega ni a 10 minutos',\n",
+ " 'Fanta le vas a regalar un vinito?',\n",
+ " 'Zzzzz. Denle la pastilla antes de entrar porque se le lengua la traba y no modula, como en el debate',\n",
+ " 'Buen dia chicos!! Buen comienzo de semana!! Participo por el secador de pelo de #lasmargaritas #ElClubDelMoro @la100fm @SANTIAGODELMORO',\n",
+ " '#ElClubDelMoro @SANTIAGODELMORO \\n@la100fm \\nParticipo por el secador de #lasmargaritas',\n",
+ " 'Que vieja infumable. Si Insaurralde es millonario imagínense a la jefa de la banda. Tiene más guita que Madonna la groncha. #PatoBullrichPresidente2023 #PatoPresidente #PatriciaBullrich',\n",
+ " 'La conchu....a',\n",
+ " 'esta sra. está igual que la Clérici, solo le importa su culo.',\n",
+ " 'Cómo te duele la cola...',\n",
+ " 'Si Roman que se vaya !!! Pero dejen de hablar de la Señorita que viajo con el paga Gato , como si fuera una Dama , inocente, es un Gato pago en el hotel del exótico pelado que tiene hotel en Miami también',\n",
+ " 'Andate vos gallina de mierda',\n",
+ " '@edufeiok estas mejor de la fisura en el ano?',\n",
+ " 'Ni sabe conjugar un verbo, primera persona plural: somos. Bruta. Chorra. Peronista tenías que ser. O k. Es lo mismo con diferente olor.',\n",
+ " 'Viejas viciosas y sin remordimientos. Ya las van a parrillar el inombrable.',\n",
+ " '@edufeiok no puedo creer las conjeturas q haces sobre el gato cascoteado de Insaurralde, es la prostituta de los peronistas ma q novia',\n",
+ " '@edufeiok El oficialismo se hace el espantado con Insaurralde, pero piensan. :.que.tipo.pelotudo!! Cómo se dejó.agarrar.! Cosa de vedetongas !',\n",
+ " '@edufeiok No se metan con el gato, ella es una laburante el tema es quien la contrata',\n",
+ " '@claudiosavoia @edufeiok @EldiariodeLeuco\\nEL HIJO DE PUTA MAS GRANDE ES EL GATO FUGADOR DE 45 MIL MILLONES DE PALOS VERDES Y TODA LA JUSTICIA CORRUPTA COMPRADA POR ÉL\\nEL ARMADOR DEL INTENTO DE ASESINATO A CFK MILLMAN Y.SUS PUTAS. Y TODOS USTEDES ENSOBRADOS DE MIERDA! SE LES ACABA',\n",
+ " 'Cómo te duele que le haya ganado a la beoda que ya ni las neuronas le responden\\nAhhhhhclarooooo estaba engripada jajaja ',\n",
+ " 'Es una tarada abortera igual que vos. Bobo',\n",
+ " 'La feminista que le gusta hacer piquete. PERO ELLA DICE QUE RECLAMA PARA QUE LOS NIÑOS COMAN. AHH CLARO MIS VIEJOS ME ENSEÑARON QUE CUANDO NO HAY PARA COMER HAY QUE SALIR A PEDIR. PERO POR FAVOR NO SEAMOS IGNORANTES.',\n",
+ " 'Concuerdo totalmente lástima que parece querer eliminar el género masculino. Se pasa de feminista',\n",
+ " 'Volvé al closet que eras mejor periodista y más objetivo que el metro sexual (autopercibido) LGBT y abortista que sos ahora',\n",
+ " 'Cerra la cola esa llena de aire que tenes mariposa llorona y zurda',\n",
+ " 'Jajaj nosotros tenemos a la leona villaruel, una patriota, pato criollo es una traidora subversiva.... fin del relato',\n",
+ " 'Bregman la delincuente vaga',\n",
+ " 'Bueno ya sabemos de q lado estás, no te imaginaba al lado d la zurda con OSDE !\\nSacar a Maldonado de la tumba, una ridícula, el temita mujeres me tiene harta, los hombres son desechables, vos por ejemplo, no canta el himno y no se siente Argentina\\nPero presidenta, SI?!\\n#Pato2023',\n",
+ " 'Solo piensa en seguir viviendo de la gente llevando a los piquete a los planeros obligados y victimizando a las mujeres!!!',\n",
+ " 'Seguí en club haciendo orgias con tu marido salame',\n",
+ " 'la pelotuda de la Bregman todavia sueña con tomar el palacio de invierno de los Romanoff...!!!! ya fue , la forrita esta atrasa +100 años...!!!!',\n",
+ " 'Estás como looooook con el debate. Tu candidata la peor de todas.',\n",
+ " 'SI VA ESCABIADA QUIZA SE LE ENTIENDA',\n",
+ " 'Su fuesen japi no te perderías...',\n",
+ " 'Insaurralde-gato con O al final. Ah perdón mala mía',\n",
+ " 'El gato d insaurralde es el mismo que el d.scioliii ',\n",
+ " 'Está como la tuya ,la borracha,afuera jajaja judío estás al horno,si gana el gatito sin pauta,vas a tener que gastar la de papá,otro que vivió del estado siempre',\n",
+ " '@MalenaGalmarini Revisa el telefono de Ventajita que era amigo de este come gatos caros de Insaurralde. Te vas a llevar una sorpresa, bue tu viejo come gato, viejo pasado.',\n",
+ " 'Tendrian que poner una foto de la tatuada mostrando el orto.',\n",
+ " 'Que renuncie a la intendencia \\nQue lo investiguen a el y sus hijos mayores\\nA la Cirio que recibió 20 millones de dólares \\nY al nuevo gato monotributista',\n",
+ " 'Con el colchón caliente',\n",
+ " 'Con lo falta que te hace falta garchar a vos gordito lechoso...los cuernos aflorando.',\n",
+ " 'Con las putas que “lo florean” como no se van a olvidar! Te la tomaste toda sinvergüenza!',\n",
+ " 'Jajajaj el dro gon y el paga gato gobernaron 4 años ... pobres ahora todos sumidos en el barro mientras ellos serán millonarios por siempre, entendés la importancia de votar bien?',\n",
+ " 'INSAURRALDE GATEROOOOOO PONELA PERO CON LA DE TU BOLSILLO NO CON LA DEL PUEBLO',\n",
+ " \"¿Qué t metés con @Kicillofok? es intachable y no tiene la culpa de dónde la mete @minsaurralde . Dsd Perón y las pibas universitarias, pasando por el turco traidor y su harén, siempre están los q' gastan en pu ras vedetongas o travestis, qué querés que haga Axel...? ¿castrarlo?\",\n",
+ " 'Se fue al joraca con lo de la facha bárbara… lo de las prostitutas, yates, rolex, regalos lujosos y extracciones millonarias de cuentas de banco todavía se bancaba…',\n",
+ " 'Le gustan los gatos nomás, está prohibido?',\n",
+ " 'De la manada de gatos que Milman puso como asesoras que pagamos con nuestros impuestos no te escuché ningún comentario, y Gerardo sigue en su cargo y la mayoría de los felinos también.',\n",
+ " 'Y todos sabemos q vos sos un chupa pija y?',\n",
+ " '@JonatanViale Joni si a este gato le pagaron para deschabar a Insaurralde, debe de haber sido muchisimo para saber q su trabajo de gato se termina, ya no es confiable como todos. Si hay algo q saben es q tienen q hacer silencio',\n",
+ " '@JonatanViale Joni, esta mina es una Prostituta fina, busca giles con plata y los seca. Cirio es diferente? Abz',\n",
+ " 'Fue la única que mencionó a Insaurralde tu pollo Milei la zurda de Bregmman y el agente de viajes de Córdova no lo mencionaron. Es corrupcion es escándalo y vos solo decís que PB no hablo lo suficiente de eso? Se te nota mucho chirolita, ya sabemos quien es tu ventrílocuo',\n",
+ " 'Che hombre rata, ¿A quién mierda de aquí para adelante lo de Insaurralde? La borracha no propuso nada y el degenerado la puso contra las cuerdas con el tema de las Leliqs, se nota que no sabe una mierda de economía.',\n",
+ " 'Qué esperabas de una señora que está más cerca del geriátrico que Insaurralde de los gatos. De verdad considerabas a esa mujer como una candidata seria??? Le podés preguntar su plan económico, porque a Milei te faltó preguntarle el tipo de sangre nomás cuando lo entrevistaste.',\n",
+ " 'Cómo me gusta el olor de pautero cogido por la mañana.\\n\\nSe te acaba la joda, Mandela.',\n",
+ " 'Que pasa que no se acciona con esa corrupta? La cara de estúpida y su mal gusto parecía bobo .flor de chorra',\n",
+ " 'Se fue de putas y renunció, ahora habla de mil man.',\n",
+ " 'Le va a pedir el disfraz a bulrrich q se puso con lo de millman y sus asesoras gatos, de eso no hablas? Periodista independiente',\n",
+ " '@barilirodolfo Che Rolo que te paso en la trucha que la tenes toda podrida??? A vos también te opero Lotocki por canje???',\n",
+ " '@barilirodolfo aflojale al botox, sos un muñeco de cera a punto de derretirse!!!\\n\\n#Debate2023 #DebatePresidencial2023',\n",
+ " 'Ig de la minita ?',\n",
+ " 'casi no la conozco @lulitru con la cara hecha \\nlabio y algo mas creo, linda \\n@EstebanMirol capo, claro y tranquilo, le pasa el trapo a @barilirodolfo mojado y tembleque nervioso',\n",
+ " 'Che,los 20 palos verdes no te parecen un programon gato?',\n",
+ " 'Ojalá la Cirio se vaya porque no es útil en ninguna parte del programa. No sabe ni de cocina ni de música.',\n",
+ " 'Hay que mantener ese gatito ehhhh. Seguro fue tan cómplice como el, hasta en la tele la acomodo.',\n",
+ " 'para cuando presaaaaaa!? A un pobre emprendedor que se pasa 10 cm con la medida de un consultorio le clausuran el local y a este gato VIP le dan 22 MILLONES DE DOLARES y va tranquila a laburar?!!!',\n",
+ " 'ENSONBRADO, hablá del gato de Insaurralde disfrutando de vacaciones en Marbella con la NUESTRA ',\n",
+ " 'Hace rato que el turco habla y no dice, solo engaña al pavote de @gato',\n",
+ " 'No pueden ser tan giles la @myriambregman trabaja p ella como todo dirigente #zurdito Con ese 4 o 5% se acomodan en la burbuja dla \"casta\" mientras a sus piqueteros NO LES CONSIGUEN NI TRABAJO \\nFeministas son las mujeres q piden x sus derechos y no x #cargos \\n@C5N @Gatosylvestre',\n",
+ " 'Solo te voy a decir que a @myriambregman le doy bomba hasta que se ponga un pañuelo celeste en el cogote...',\n",
+ " 'Milman se anota, pero pide que no la llamen \"gato\" sino \"asesora\".',\n",
+ " 'Voto el gato sylvestre, navarro, tomi massa y daddy brieva.',\n",
+ " 'Para toda la sarta de chupapij4s como vos pudo haber ganado algo el panqueque en versión zen...! Al festejo post debate lo organizó Martincito...? Altos gatos habrá llevado...!',\n",
+ " 'Ojalá Robert!! Así gana en primera vuelta, arregla todo el desastre que ud mismo hicieron, y mete presa a la yegua!!!!',\n",
+ " 'Ganó tu puta !!',\n",
+ " 'No hay japi que les venga bien a ustedes.',\n",
+ " 'Ninguno tenía la cola limpia seguro',\n",
+ " 'Increíble que usen de la nuestra para mantener gatos!',\n",
+ " 'Increíble que se use el presupuesto para pagarse las putas che.',\n",
+ " 'Un día te va a explotar la BURBUJA que tenés de cerebro!!! ',\n",
+ " '@robdnavarro TROLL K A SUELDO LÁVATE EL ORTO y TOMATE LA SOPA \\nDigas lo que digas YA LA TIENEN ADENTRO y SIN VASELINA ',\n",
+ " '@aleberco tenés que poner en la cortina lo del #gatitomimoso de @myriambregman !!',\n",
+ " 'Para poder escuchar a @aleberco hay q tragarse los sapos de la @BallesterDani el fanático del gato y la chupamedias de Alberto: Ayerdi...@C5N #Debate2023EnC5N',\n",
+ " 'Por tipos como vos nació un Milei, por culpa del feminismo y por la identidad de género ahora nos vamos a tener que fumar a este loquito. Dios nos ayude!!!',\n",
+ " 'No rompas las pelotas gorda histérica , si existe otra visión es xq la gente no es imbécil como uds',\n",
+ " 'como se nota que tenes la barriga llena vos... los argentinos están preocupados por temas mas importantes como comer.',\n",
+ " 'Chúpale el culo Branca',\n",
+ " 'Y el fullero? Así nos va, miseria, pobreza, inflación imparable, y quiere ser presidente panqueque!',\n",
+ " 'Pero ustedes saben de gatos.',\n",
+ " 'Lleno de botox y cama solar....o estuvo en republica Dominicana?????????',\n",
+ " 'el botox no le dejaba cerrar el ojo, como a vos no te permite abrir la mente',\n",
+ " 'derrotada está tu cola, mamaza',\n",
+ " 'Insaurraldea repugnante k homenajea gatos..\\nMiau gordi to',\n",
+ " 'A vos te gustan los violines culo roto',\n",
+ " 'Cerra el cul0, mequetrefe!',\n",
+ " 'Lo que se te traba a vos son las guampas caracol',\n",
+ " 'Si. Obvio que a vos te va a interesar, pedazo de Judas!',\n",
+ " 'Jajaja anda manita menos mal le queda poco',\n",
+ " 'Jaaa q te la den a vos así seguiste viajando. C tu amiguito con alguna hembra',\n",
+ " 'Pero si al trabajo ya se perdió cara de pija',\n",
+ " '“Sos un Gatito mimoso del poder económico”\\n\\nAplausos para @myriambregman',\n",
+ " 'Acá el gatito vip con el kirchnerista amigo del gordo frulalá',\n",
+ " 'Hablando de gatitos, no te hizo ruido con los de ustedes? Que aparte son carísimos',\n",
+ " '@diegobranca no escuché que dijeras nada del delincuente kirchnerista que puso Mínimo en la jefatura de Limitado y que la yegua condenada por corrupta lo queria de candidato a presidente. Sos tan hijod1000pu a como ellos',\n",
+ " 'Se estuvo cuidando toda la semana......Síndrome de abstinencia. Tendria q haber ido copeteada....para agarrar valor',\n",
+ " 'Le falto la previa, se mando al boliche de una',\n",
+ " 'Se traba pero haciendo y laborando les pasa el trapo a todos. Se sabe',\n",
+ " 'Trabajás en c5n?\\n\\nLas putitas de insaurralde te agradecen.',\n",
+ " 'Pareciera que le están dictando por cucaracha si la hacen peinar para atrás creo q se le ve el auricular jajajaja.\\nEl único que está diciendo cosas coherentes y se le nota que tiene xperiencia en gobernar algo es schiaretti. Además conoce el interior',\n",
+ " 'El botox que se hizo no la deja vocalizar .No se entiende nada ',\n",
+ " 'Se le lengua la traba.',\n",
+ " 'Píldoras.',\n",
+ " 'Siniestro son ustedes caradura, ni hablar la veces q amenazaste tus ex parejas, cuando agrediste verbal y físicamente tus ex parejas etc etc y ahora sos pañuelo verde caradura',\n",
+ " 'Siempre igual el gato haragán...que asco',\n",
+ " 'Chupadte una pija huevo duro. Ocúpate del cerdo q va hacer visitas higienicas',\n",
+ " 'Cómo te supera el resentimiento, nunca serás presidente de Boca ni Presidente de la Nación, nunca tendrás una primera dama como la gente no un gato!!!!',\n",
+ " 'Vos sos mas sorete que esa mujer huevoduro. Sabelo',\n",
+ " 'Que asco me das huevo seco dios te castigó y nunca vas a tener hijos legitimos',\n",
+ " 'yo creo q soy una loca trastornada porq hablo con mi viejo q esta muerto y a mi perra q ame.. vos no sos capaz de hablar con tus hijas q son dos desastres',\n",
+ " 'Ya muchos se dieron cuenta de la pelotudez de tocer cuando le tocaba hablar',\n",
+ " 'Ojalá el domingo te demos en la pera por cucaracha',\n",
+ " 'A da a la renegrida concha de tu hermana.. sorete..!!',\n",
+ " 'ni una prostituta esta tan interesada por dinero....',\n",
+ " 'Lo que es ser misogino producto de tu incapacidad de embarazar a una mujer.',\n",
+ " 'Ya te \"volviste\" tan comprensivo con la mujer despues de hacerlas mierda durante año, no decis nada de lo que paso con una mujer que le pasaron los huevos por la cara? O no te queda ser tan feminista?',\n",
+ " 'BASURAS, MILEI NI SE MOSQUEÓ, SIGAN TOSIENDO LECHE DE MASSA',\n",
+ " '@fantinofantino andá buscándole trabajo en alguno de tus programas a tu pollo...',\n",
+ " 'El Virolo y Porota son bebés de pecho al lado del Fullero y la reina de la canilla',\n",
+ " '@RomiUhrig la mas hermosa con ese vestido tan sexy y las mejores piernas ',\n",
+ " 'El 19 te metes en la sábanas de Miley y Fátima te vas a comer',\n",
+ " 'Dibijadadisima',\n",
+ " 'Ojo con la rubia, si ve una foto de Massa se deprime y se pega un palo',\n",
+ " 'Jajaja, que meada se comió el gatito mimoso. vergüenza ajena',\n",
+ " 'Que baile le pegaste a gagaresio',\n",
+ " 'Los comunistas se amparan entre ellos , este musico ya estuvo con las del pañuelo blanco y con otra gente de dudosa reputacion.',\n",
+ " 'Alojo? Agarrá un diccionario burra',\n",
+ " 'UN TROLL OPINA',\n",
+ " 'Esta gallega meada y descuajeringada, es otra delincuente acusada de plagio\\nLN+ rascando el fondo del pozo ciego',\n",
+ " 'Nooo vos parece que preferís matar mujeres y tirarsela a los chanchos..como en Chaco',\n",
+ " 'Vos ni un kiosko podés atender, tengo voz propia no dependo de nadie..lorito barranquero',\n",
+ " 'Lacha es un chantun y tiene toda la campera adentro',\n",
+ " 'esta gallega pelotuda, seguro que cobra por decrle a los pelotudos que la miran, las pelotudeces que quieren escuchar...\\nMASSA, lo paseo en chota, al desquiciado...',\n",
+ " 'Faltó el gato, ustedes dos ensobrads y que gritaran ganamos abrazando la bandera inglesa @edufeiok @PRossiOficial que manga de mal paridos',\n",
+ " 'Cómo se nota que nunca viste una conch@ en tu vida virgintario repelente de vaginas',\n",
+ " 'En tu cara @BallesterDani',\n",
+ " 'Mate con ver ga en el orto te vas a llamar a partir del lunes ...',\n",
+ " 'En pija',\n",
+ " 'Le arde la cola al mariquita',\n",
+ " 'Que domada! @edufeiok ',\n",
+ " 'El cuco y el hombre de la bolsa no existen. MILEI 2023 mi presidente',\n",
+ " 'Anda a lptqu parió novarecio y tu travesti colectivo trans',\n",
+ " 'Sos una mariposa resentida es un animal de la selva tambie , pero su opinion varia dependiendo de su pobre juicio moral.',\n",
+ " '@luisnovaresio uds 3 vayan buscando laburo viene la compañera ESMERALDA Y CHAU a laburar d verdad',\n",
+ " 'Ayúdame a conseguir esos $20.000 para la cirugía de rubia alias: Mariana.Ibanez.Este',\n",
+ " '@luisnovaresio el putarraco..dice no m meto en ese tema..HIPÓCRITA SOS CÓMPLICE..',\n",
+ " 'Da asco esa resentida',\n",
+ " 'Que asco el sucio degenerado de @luisnovaresio en la pantalla de @LANACION',\n",
+ " 'Se te van a paspar los labios de tanto besarle el ogt',\n",
+ " 'Agarra servilleta para limpiarte la leche que te quede en la boca joni',\n",
+ " 'El gatito mimoso jaaaa no vayas a toser, jonyyyy',\n",
+ " 'Que chupada de pija le estás pegando',\n",
+ " 'Que de plata estas haciendo jony. Si te viera tu viejo por favor. SOS un sicario',\n",
+ " 'Al final no lo maneja el.perro delas allá ...lo maneja el gato del más acá \\n..tu jefe Macri Viale ensobrado\\nMilei es casta',\n",
+ " 'Llévate una toalla para limpiarte la leche',\n",
+ " 'Se la vas a mamar? Sí o No?',\n",
+ " 'Llevate unas servilletas para limpiarte lo que te quede en la carita',\n",
+ " 'Charlamos? O chuparas medias?',\n",
+ " 'Charlando??, a mi me parece que se la estas mamando !!',\n",
+ " 'Tan chupa pija sos?',\n",
+ " 'Lavate los dientes después, cochinote',\n",
+ " 'Le vas a chupar mucho las medias ??',\n",
+ " 'Se la va a mamar en vivo?',\n",
+ " 'Más que mano a mano, vos le vas a estar chupando la pija. \\nAsco das.',\n",
+ " 'Con calzones de lata está vez !!???? Cómo le quedó el clt o anoche',\n",
+ " 'Se viene mamada en vivo, gordo tragaleche???',\n",
+ " 'llévate una servilleta para limpiarte la boca, chupa pij4.',\n",
+ " 'Flor de chupada de pija le vas a dar, no? SOS un loco lechita...',\n",
+ " 'Otra chupadita de pija? Le dijiste que se bañe por lo menos? \\nTu viejo se está revolcando en la tumba, no puede creer lo panqueque y vende patria que le salió el pibe',\n",
+ " 'lleva pañuelitos descartables man... ',\n",
+ " 'Ya preparadas las rodilleras y las pastillas Halls de menta???',\n",
+ " 'El gatito mimoso de la casta con el gordito lechoso ',\n",
+ " 'Le vas a tirar la goma como a M*cri?',\n",
+ " 'Reparti antitusivos en el set, no vaya a ser cosa que se sienta incomodo el gatito....',\n",
+ " 'Te vas a tomar toda la chechona, chinwenwencha! ',\n",
+ " 'Limpiate el bigote de leche',\n",
+ " 'Jonnyy no le levantas la imagen ni inyectandole viagra en sangre al javo',\n",
+ " 'LLEVA LAS RODILLERAS, LAS MISMAS QUE USAS CON TU PATRÓN. \\nG.L.',\n",
+ " 'A la sin hueso como siempre...\\nAl hueso*\\nMala mia',\n",
+ " 'No perdés oportunidad de reafirmar que te gusta chuparla y que te dejen la leche chorreando en la cara.',\n",
+ " 'Ufff la de lamida de glande que va a haber ahí!',\n",
+ " 'Te hiciste la tira de cola ya?',\n",
+ " 'No te olvides las rodilleras y el babero así no te lastimás ni te manchás la camisa con semen de \"la vaca mala\".',\n",
+ " 'se viene la mamada del siglo. no tosas por las dudas...',\n",
+ " 'Hoy la vas a tragar también?',\n",
+ " 'llevate el babero',\n",
+ " 'Prepara las rodilleras!!',\n",
+ " 'Pedile que se ponga medias nuevas y prepara tu lengua para una buena chupada, y no te olvides de preguntar a tu patrón Mauri que podes decir y que no.',\n",
+ " 'Haciendo el laburito fino\\nPrepara la garganta para tomar la chechona',\n",
+ " 'Uhh se viene la una succionada de pn asquerosa @c0o0ni',\n",
+ " 'Pero paren de chuparle la Japi, déjenle algo a la hermana!!',\n",
+ " 'otra vez vas a chuparle la pija a milei joni? ah pero flor de putita de macri sos eh',\n",
+ " 'Cortate las comisuras de los labios que dicen que es una anaconda',\n",
+ " 'ya te pusiste las rodilleras?',\n",
+ " 'Ya preparaste la cola ?',\n",
+ " 'No te olvides las rodilleras. Te va a quedar la mandíbula atrofiada de tanto chuparle la pija.',\n",
+ " 'Le vas a dar otra chupada de Japi?',\n",
+ " 'seguramente será una gran felanota',\n",
+ " 'Te la vas a tomar toda chjinguenguencha',\n",
+ " 'Que lindo verte en vivo y en directo tirando la goma gordita',\n",
+ " 'No vas a toser hombre leche….',\n",
+ " 'Ponete el babero por si se te chorrea la leche',\n",
+ " 'Lactiboy hoy tenés q ganar horas extra',\n",
+ " 'Derrama la leche gatuna',\n",
+ " 'Hoy se la maman con las dos manos?',\n",
+ " 'Ufff vas a hacer un pete fantástico dogor, ya veo, el mejor porno! \\nescondan a Marra q se va a romper una mano.',\n",
+ " 'Paaaa la atragantada q te vas a pegar con las medias del javi',\n",
+ " 'preparando las rodilleras',\n",
+ " 'Llévate servilletas para limpiarte la leche de la cara joni',\n",
+ " 'No te olvides las rodilleras',\n",
+ " 'Rodilleras Jonatan, después estas con todas las rodillas peladas.',\n",
+ " 'No te olvides las rodilleras',\n",
+ " 'Sos el perrito que se llama mentís,mentis,mentís.. están desesperados y salen con cualquiera jijij',\n",
+ " 'Deja de ladrar y anda a laburar para pagarle el tto',\n",
+ " 'Chupa el palito de helado León ',\n",
+ " 'Che, no te quedan problemas en la mandíbula? Mucha pija estás chupando.',\n",
+ " 'Como te duele la cola...',\n",
+ " 'Actualiza el CV, rata',\n",
+ " 'Preguntale porque comparo un partido de fútbol con la guerra de malvinas. \\n\\nNo le hagas caricias al gatito mimoso. Ejerce 1 puta vez en tu vida.',\n",
+ " '2 petardos en una semana, ya sos más que fatima y karina',\n",
+ " 'Se te ve la tanga, cara de pija.',\n",
+ " 'Capaz tenes mas suerte metiéndote el dedo en el ogt',\n",
+ " 'Ya que sacaste el dedito, metetelo en el upite.',\n",
+ " 'Me parece que sacaste la cola por la ventana, te pusieron un dedo',\n",
+ " 'Ya tiene novio nuevo, nunca un verdulero..',\n",
+ " 'Realmente al gatito mimoso,se le agotó el ronroneo, me parece que en el debate le hubiera quedado bien la Grace de Bernardo Neustadt ,(no me dejen solo) este tipo es un cachivache!!!!!',\n",
+ " 'Como cambiaste nacho desde que trabajas con el gato.',\n",
+ " 'Hola gato bueno ahora hay que hamar',\n",
+ " 'No va porque tiene la Co laa sucia',\n",
+ " '@Gatosylvestre \\n@BallesterDani \\n\\nOJO MILEI VA USAR AURICULAR TAPADO POR EL PELO PARA QUE LE DICTEN!!',\n",
+ " 'Acá estamos firmes a C5N como siempre la realidad mas que nunca en este domingo otro día especial para el país en el último debate presidencial de cara al balotaje ecxelente cobertura de C5N los mejores siempre que bueno verte gato sos un grande lejos y acompañado de la dama dani',\n",
+ " 'Los dos gatos.',\n",
+ " 'Vos no ahorras en dólares gato?',\n",
+ " 'Deja de tragar leche',\n",
+ " 'Y vos ??? Qué sos??? Representás a la buena gente??? A los que asustan??? A los que empobrecen??? Andá palla BOBOOOOOOOOOOOOOOOOOOOO',\n",
+ " 'y le siguen dando a la maquinita: TN, LN+, los trolles liberfachos\\nreviviendo (digamos...) el debate tratando de opacar la paliza del MassaPalooza de anoche',\n",
+ " 'Patotera y ahora te echas atrás?',\n",
+ " 'Porque te gastas Rey en responderle a un taguerna que no se sabe limpiar el OGT..',\n",
+ " 'Jajaja ni idea la mina',\n",
+ " 'Es como hablar de hombre panqueque,chorro, mujer y familia monto ,no digo desde hace más de 35 años',\n",
+ " 'De eso solo se ocupa el gato, te da cátedras d espionaje y auto secuestros',\n",
+ " 'Las ojeras en esa carita son de exceso de la alternativa Marrista a la ESI',\n",
+ " '@RAMIROMARRA\\nUn consejo. Largá la paja, te está haciendo muy mal, te está quemando las neuronas.',\n",
+ " 'Rencoroso el gatito mimoso',\n",
+ " 'Jaja\\nAsique no le vas a hacer una rabona a Yepes!??',\n",
+ " 'Que hdp...ni el gatito mimoso se atrevería a tanto...',\n",
+ " 'No se tiene que vestir.. así se la mamas por los sobres...',\n",
+ " 'Tu mujer está desnuda salamin',\n",
+ " 'Escupila que te vas a atragantar...',\n",
+ " 'Ahora no es gratuita ni de calidad lechón impotente',\n",
+ " 'Vos recibís más sopapos todos los días traficante de grasas trans, y seguís por acá. Más chupa pija que vos no se consigue sorete',\n",
+ " 'Sopapo te daría yo !!! Pedazo de mierda!!! Un solo cachetazo y te acomodo la única neurona que habita ese cráneo vacio',\n",
+ " 'Existe posibilidad que la dogor de tu jermu tire la goma',\n",
+ " 'te tiramos una toallita femenina a vos?',\n",
+ " 'En unico ignorante sos vos, seguro que si te cruzo por la calle salis corriendo, ni siquiera sos guapo para resolver las cosas como hombres...',\n",
+ " 'Un pañal por acá, por favor',\n",
+ " 'Chupa culo de un chupaculo ,que desagradable .\\nO sea chupaculo de 2da. Bua',\n",
+ " 'la puta del gobierno salió a hablar',\n",
+ " 'Vos das vergüenza, arrastrándote por una pauta y un plan, traga leche hijodeputa',\n",
+ " 'Dieguito estás diciendo huevo con la boca cerrada. Vas a necesitar crema hemorroidal.',\n",
+ " 'Estab militando a masita igual q militaron a alberso ustedes, jajajaj sapo tras sapo se meten x el culo y la vieja condenada cagandoseles de risa con su vida d millonaria…eso si condenadas hsta el ultimo d sus dias',\n",
+ " 'Jajajjaaajja anda a votar vos a peluca loca bigotón boludo ',\n",
+ " 'Por desgracia para vos, la virginidad no la puedo recuperar.\\nPero vos tampoco te podés recuperar de ser un traba violador de menores.',\n",
+ " 'SOS un desastre de persona, lo mismo perfíl que por una pauta se vende como puta',\n",
+ " 'Te felicito por la poronga que te comiste esa cara fue inolvidable, ahora ándate a laburar a mexico y ojalá te vaya bien así no volves mas',\n",
+ " 'Como te duele la colaaaaa',\n",
+ " 'Que paso intento de mafia,que paso con MILIE, anda a ayudar a la falopa de la gorda chancha de hija que tenés ,explícale como la conseguiste así deja de ser tan asquerosa tu hijita HDP',\n",
+ " 'Como esta tu orto? Arde mucho?',\n",
+ " 'BAJATE RIAL HACELE CASO A VENTURA A LA NIÑA TROLI BAJATE andate a España lpmqtp',\n",
+ " 'Hermoso ver las caras de tuje… ',\n",
+ " 'Queríamos verles las cara de orto! Empezando x vos!!!',\n",
+ " 'La tenés todita adentro!',\n",
+ " 'NO NOS OLVIDAMOS LO Q LE HICISTE A BEATRIZ SALOMON HIJO DE PUTA !!!! VOS Y LAS GORDAS PUTAS DE TUS HIJAS VACAS LECHERAS',\n",
+ " 'Aprovecha que va a haber venta de órganos y búscate un par de huevos, hijo de mil putas',\n",
+ " 'Trabquila esta tu cola jjaja, o estas mal porque perdes los sobres. Ni tu hijas te quieren',\n",
+ " 'Habia un sapito hablador..que le paso? Se lo comió el León?! el chiste se cuenta solo ',\n",
+ " 'Andá a laburar Manu',\n",
+ " 'Las nenas no tienen cerebro !\\nDe tal palo tal astilla.',\n",
+ " 'Parásitas inservibles',\n",
+ " 'Me corto las venas ,que minas boludas y vagas',\n",
+ " 'Mira las hijas \"D\" el pedo filo, maltratador, violento, maleducado, el q trato de CHORRAS a sus hijas y su ex, el q dijo q si tenía enfrente al hijo italiano lo escupía, al q murió solo como perro, al q eligió la droga y la joda ants q a sus hijos !D verdad c cuelgan dl muerto',\n",
+ " 'Me das tanto asco, tenés lo que te mereces',\n",
+ " 'Te chorrea lo gato pago que sos rial',\n",
+ " 'Maltratar a las mujeres',\n",
+ " 'Dale dale Jorgito Seguí pegando que necesitas sobres más abultados. No descanses!!! Dale nomas. Total dsp vos te vas a trabajar afuera,te gastas la q vas a ganar con el gato de turno,y a nosotros nos dejas con los corruptos y narcos gobernandonos.',\n",
+ " 'A vos se te ocurre denigrar a las mujeres. Dejarlas sin trabajo. Y demas.cosas',\n",
+ " 'Cerra el orto violin',\n",
+ " 'Aprovecha la venta de órganos a ver si podes vender los huevos!!!\\n\"MAYONESA DE VERDURAS\" (no tiene huevos)',\n",
+ " 'VOS TENES LA \"RABA\" PELUDA LLENA DE LECHE.... CONCHUDA..... Y BLOQUEAME FORRA SI NO SOS NADIE... NADA MAS PARA QUE TE PUTEE',\n",
+ " 'Chorreas veneno..estás a favor de ka muerte.. sos una pobre mina resentida',\n",
+ " 'Vamos morena!!! Andá con el pai de nuevo!!!!',\n",
+ " 'Se lo dijo ...ahora inflable del gato',\n",
+ " 'Que sabes el país que se viene idio ta, enséñale a trabajar a tu hija',\n",
+ " 'Basura este maltratador de mujeres este sangano es complice de corruptos devolve todos los sobres basura...y marche preso hipocrita hay un Dios y la tenes q pagar machirulo',\n",
+ " 'Qué mina asquerosa!!! Poca empatia. Lo que no sabe es que ella también se va a joder.',\n",
+ " 'Pobre huevo seco .Se la comió doblada y con un nudo en la punta !!!',\n",
+ " 'chupa japi',\n",
+ " '@rialjorge ¿es necesario que hoy nos tengamos que fumar al gato jovato sin tetas ni cerebro hablando del peronismo? APAGUÉ.',\n",
+ " 'Es el país de chupa pijas que vos también vas a aceptar,chupa berga.',\n",
+ " 'Dale bobalicona , en unos meses te veremos cómo estás, hoy por lo menos le entrabas a la Presto Pronta, anda cuidando el césped por las dudas.',\n",
+ " 'Cerra el orto y anda a revisar la polenta',\n",
+ " 'Ya ganaste plata con el javo?',\n",
+ " 'La querés chupar un rato?',\n",
+ " 'Que desagradable debe ser chupar un culo todo roto.',\n",
+ " 'A la pelotita otro corredor de maraton en culo!!',\n",
+ " 'Q le perforen el orto',\n",
+ " 'que cogida que te pegaron hace baño de asientos.',\n",
+ " 'Flaco 40% de pobres, agradezcan ustedes hijos de re mil putas que no los estamos ahorcando con alambre de fardo en el obelisco FORRO HACETE CARGO UNA PUTA VEZ DE ALGO NEGRO PUTO',\n",
+ " 'Javi anda poniendote un Parripollo.',\n",
+ " 'Acá lo tenés al pollo de @fantinofantino una joyita @m_cuneolibarona',\n",
+ " 'Basta de tortas y putos con problemas en los orificios, ponete un kiosco o un uber',\n",
+ " 'Lali la mogolica así era la canción?',\n",
+ " 'Sos tremendo hdp miserable das mucho Ascó el sobre tiene que ser grande para chupar tanta pija',\n",
+ " 'No largá el sillón y el negocio ni loco!',\n",
+ " 'Renunció al whisky',\n",
+ " 'Crees que va a largar la torta??????',\n",
+ " 'Tu mujer,como chupa la pija',\n",
+ " 'Y vos por fachito no te vas a pedir licencia nunca? Nos harías un gran favor',\n",
+ " 'Se van de a uno las rartitas porque saben que si se quedan para el 10/12 van directos en cana.',\n",
+ " 'Hace falta que te toque los huevos??',\n",
+ " 'las órdenes no se la daba el perro muerto sino el gato vivo y psicópata',\n",
+ " 'Asco das vos, chupa japi!',\n",
+ " 'Igual son para limpiarse las partes,o levantar la caca del perro',\n",
+ " 'Seguro son las feministas, les encanta orinar en lugares públicos.',\n",
+ " 'Eduardo, Hay otras con excrementos!!',\n",
+ " 'Vos sas asco todos los días areastrandote por unos mangos',\n",
+ " 'Igualmente sirve!! Sos desagradable',\n",
+ " 'Hoy te la comes doblada...',\n",
+ " 'Ursula si tuvieras un cerebro proporcional a tu panocha no escribirías semejantes boludeces, no se quien sos, ?? Otra Jessica o clerisi… \\nHueca y calienta verga',\n",
+ " 'Por ahí ya se las ligó',\n",
+ " 'Buenas noticias, se esterilizo y ya no se reproducirá',\n",
+ " 'Quizás ya se ligó',\n",
+ " 'Quizá se las ligo ',\n",
+ " 'No resiste historia está trola!',\n",
+ " 'Y bueno, se tendrá que ligar las trompas.',\n",
+ " 'Ya se las ligó?',\n",
+ " '¿Te das cuenta Edu que implícitamente estás reconociendo que el gatito mimoso es un anormal, no?',\n",
+ " 'Quizá ya se las ató. Qué te metes con las trompas de Falopio de los demás Edu, sos un antiflash. Nadie habla de tu vasectomía, hermano.',\n",
+ " 'Capaz se ligó las trompas, no sabés.',\n",
+ " 'Se habrá ligado las trompas y se sentirá liberada de votarlo. Calculo que con la nariz tapada',\n",
+ " 'tenes una primicia ahi, se ligo las trompas!!!!',\n",
+ " 'Se fue domadisima jajajajja',\n",
+ " 'Vale destacar que es de las tantas que se hizo famosa por mostrar el orto',\n",
+ " 'Sale ligadura de trompaaaaassss, anda a Lotocki!!!',\n",
+ " 'y como ya se ligó las trompas, ya no le importa ahora!',\n",
+ " 'Ya te cortastes las trompas !! Anda sacando el turno!!! VLLC!',\n",
+ " 'y q sabes gil capaz se ligó las trompas',\n",
+ " 'Lo positivo de Úrsula es que sin trompas no se va a poder reproducir',\n",
+ " 'Dale mongo, mandas al frente a mujeres porque sos vagon vos. Forro',\n",
+ " 'Quizás se las ligó ya?',\n",
+ " 'es que ya se las ligo',\n",
+ " 'Capaz ya se ligo las trompas',\n",
+ " 'A Úrsula no la deja pensar con claridad la merka que se mete',\n",
+ " 'Hola @ursuvargues, querida, espero que hayas cumplido y te hayas ligado las trompas, no necesitamos mas panqueques en este pais',\n",
+ " 'mejor que se ligue las yemas de los dedos, así no escribe pelotudeces',\n",
+ " 'Pero se las ligó??',\n",
+ " 'Siempre contra las mujeres sionista medio polvo!! Cuando vas a salir del closet?',\n",
+ " '@ursuvargues ligate una',\n",
+ " 'Bueno que bien tal vez se las ligó. Bien por ella!',\n",
+ " 'Pero se las ligó. Tenés que chequear antes de hablar.',\n",
+ " 'Supongo que se ligó las trompas o ya le llegó la menopausia.',\n",
+ " 'So te las atas mejor ,no sea que salga otro espécimen como vos',\n",
+ " 'Quizás ya se las ligó las trompas, como periodista sos un excelente tenista, imagínate',\n",
+ " 'Por ahí ya se las ligó. Cual hay?',\n",
+ " 'Quizás ya se ligó las trompas, andá a saber!!',\n",
+ " 'Ya debe tener las trompas ligadas',\n",
+ " 'Si se las liga como va a hacer para agarrar el plan ??',\n",
+ " 'Vos, Feinmann, sos capaz de lamerle el culo a quien te ordene el gato hediondo.',\n",
+ " 'Las trolas son así',\n",
+ " 'Se las ligo y fue a votar, simple',\n",
+ " 'Como te quemas las neuronas las pepas',\n",
+ " 'Maria dicen q ella se tropezó, ya salieron a hablar x eso ? Espero q puedan salir d esta juntas y q la mina q le pego pague',\n",
+ " 'No sabes que hacer con tu vida después quedar como \\nmujer despechada sin una pizca de moral. Pretendes dar consejos sobre a quien votar.\\n',\n",
+ " 'Gracias Maribel sos una guerrera !!!! VLLC!!!!!!',\n",
+ " 'Qué mujer!',\n",
+ " 'EN C5PENE LA CARITA DEL LAMEBOLAS MÁS GRANDE QUE TIENE ESE CANAL DE MASSA, EL GATO SYLVESTRE, UNA CARA DE \"AHORA DÓNDE VOY A LABURAR?\" LUEGO DE TANTAS EFERVESCENTES LABORES DE DEFENESTRAR A MILEI QUE YA NO SABE COMO DISIMULARLO...',\n",
+ " '@edufeiok desagradable vos y el gallina váyanse a la mismísima mierda',\n",
+ " '@edufeiok @javierlanari @JonatanViale\\n En Roma y patinándose la tuya, Fabiola Fernández se lanza como artista plástica y presenta su primera obra titulada \"Me olvidé de ponerme el tampón\" ',\n",
+ " 'Como te duele la cola',\n",
+ " 'Cambia la cara de orto boludaso te querés matarrr',\n",
+ " 'Luis deja de mamar que se te va a gastar la mandíbula',\n",
+ " 'si no te gusta la concha a vos',\n",
+ " 'Y vos le crees al acosador de pronosticadores del clima',\n",
+ " '@luisnovaresio \\nQue cara de culo tenés ...',\n",
+ " '@luisnovaresio tenes vaselina?',\n",
+ " 'Seguro los peones como vos , tienen que quedar',\n",
+ " 'Apátrida.',\n",
+ " 'Limpiate la leche de la comisura, chupaverga.',\n",
+ " 'Traga leche',\n",
+ " 'Traga leche',\n",
+ " 'Vos contento porque vas a seguir tragando lechona de gato',\n",
+ " 'Si se van, pero vos te viniste y con la boquita llena de chele gordito mercenario.',\n",
+ " 'Callate quesudo anda a limpiarte bien la chota nos vamos para volver mas fuertes',\n",
+ " 'Listoooo ya te puedes sacar las rodilleras Milky AntiPatria',\n",
+ " 'Pepona contenta porque te sacaste la máscara',\n",
+ " 'Perdón Gilla vómito, lo escribí rápido y no lo leí para publicar. Da igual es y sos un VÓMITO. @JonatanViale \\n¿Ahí te gustó?',\n",
+ " 'Chupate una pija yoli',\n",
+ " 'Che hagobahia. Seguí votando gente con olor a repasador húmedo. Anda pa ya',\n",
+ " 'Ay, @JonatanViale! Sacate a esa víbora ponzoñosa de al lado! Es MUY forra!',\n",
+ " 'Cortala Canossa !!!! para que la tenes ahi @JonatanViale no suma resta , una resentida',\n",
+ " 'Acá hay otra mujer pro vida ',\n",
+ " 'Por primera vez le doy la razón a Rial.. Les rompimos el orto..\\n\\nHacete ver, ridícula!',\n",
+ " 'Mmmm...las vas a seguir chupando !!',\n",
+ " 'Acomodate porque no quiero verte llorar cuando no llegues a fin de mes...gatoo',\n",
+ " 'Pija nueva para chupar enano chu3co y resentido',\n",
+ " 'Definido que sos un culoroto',\n",
+ " '@diegoleuco no te da cosas trabajar al lado de la Cirio',\n",
+ " '@diegoleuco no puede ser que la Cirio siga en La peña del morfi !!!! Su novio de moral dudosa ...otra vez !!!',\n",
+ " 'Jesica Cirio revolenado el pasaporte xq perdio el Dni en tv despues de estar imvestigada x chorra, mentir y q el ex se fue a Europa con una trola con la nuestra, no se si es xq es tonta y cinica #lapeñademorfi @diegoleuco esperaba mas de vos',\n",
+ " 'Sinverguenza, te cagas en los argentinos, te enriquesiste con plata de otros, mugrienta, sos alto gato y mereces la peor de las cancelaciones.',\n",
+ " 'Lo que vas a tener que remarla sin sobres gato come pibes',\n",
+ " 'Así será gato, así será.',\n",
+ " '2 gatos locos y te faltó los aplausos .',\n",
+ " 'Bien la vedettonga, mira si la esposa , por ej, ee Dela rua hubiera ido vestida así, manita las novatas de los palcos la hubieran hecho mierda',\n",
+ " 'Ig de la minita',\n",
+ " 'No fue así y vos sos un forrito pija corta.',\n",
+ " 'Te esta llorando el culo, no? Jajaj',\n",
+ " 'El no es la dictadura. Vos sos una prostituta de traje, el apodo lo tenes bien puesto',\n",
+ " 'Déjate de joder periosobee asqueroso...3 viejas mugrientas meadas eran las gritonas.',\n",
+ " 'Si, ese cantico es de un par de gatos locos, pero al final recibió la ovación de la gente. ',\n",
+ " 'Que grasa esa mujer hacen buena pareja',\n",
+ " 'Mononeuronal alimentada a IMPUESTOS que NOS FALTAN en SALUD SEGURIDAD y EDUCACIÓN, cuando el ENSOBRADO HdP @Gatosylvestre dijo que los excombatientes de Malvinas habían perdido la guerra por COBARDES, no dijiste nada!!! O sos muy SORETE o los sobres q recibis son muy grandes!!!',\n",
+ " 'Arresten a la pepona Iñaki Gutiérrez es el que está atrás de todos los ataques . La rubia está llena de odio',\n",
+ " 'Cocinando polenta con gato silvestre.... a su termino maria la del barrio',\n",
+ " 'Chauuuu vaca!!!! Ahora vas a salir a patear la calle y vas a adelgazar',\n",
+ " 'Cómo te sangra el culo gato cobarde no les resulta más la campaña del miedo',\n",
+ " 'Jajajajajaja verte llorar gato es un bonus track de las elecciones jajajajaja',\n",
+ " '@Gatosylvestre tranqui...afloja....Rubinska esta acostumbrada a lexico de footbol..nervios...incertidumbre..lo que falta que el loco gane',\n",
+ " '@BallesterDani @Gatosylvestre van a tener que empezar a laburar chiques...!!!',\n",
+ " 'El gato está nervioshoooo y Toto trata de tranquilizarlo y Lulu también',\n",
+ " '@robdnavarro @eldestapeweb @C5N @Gatosylvestre @pabloduggan Gordo cara de chancha preñada...se te/les acaba el curro de la pauta y la plata fácil, violadores linguísticos, mercenarios del mal, hijos de puta de polvo mal echado...',\n",
+ " 'Que el señor empiece por tu marido!!!',\n",
+ " 'Roberto hacete ortear cuerno seco',\n",
+ " 'Sta bueno el montaje de audio , estuve ahí y solo eran como máximo 10 viejas resentidas. Mentile a tu señora que no ella te cree.',\n",
+ " '3 munipas fascitas de la 3era edad igual que vos @robdnavarro',\n",
+ " 'Eran 4 gatos.... mira de nuevo todos los videos falopero ensobrado q duce llamarse periodista',\n",
+ " 'Se ve que vos el colón lo conoces por fuera, infórmate bien, impresentable.',\n",
+ " 'La tenés adentro culo roto. Fue ovacionado',\n",
+ " 'Como te quedó la cola???',\n",
+ " 'Despertó, es verdad. Ponete crema y a buscar laburo. TN no te vuelve a tomar ',\n",
+ " 'Quisiera estar viendo la cara de orto que tenes jajajajaj',\n",
+ " 'Tampoco exageres succionador profecional de subsidios, solo eran 10 viejas meadas y un trompetista que al final fueron opacados por los que aplaudieron de pie a Milei.',\n",
+ " 'Jajaja 3 gatos lokosss. Sigan con su show. El 19 se vota un cambio. Basta de ñoquis k',\n",
+ " 'Se te acaba el curro Putito',\n",
+ " 'Espero que hayas dilatado bien ese culo porque la verga te está entrando con fuerza y no hay vaselina',\n",
+ " 'Dalee con un patrimonio de 300 mil pesos y no le econtraron pruebas? A Jesica Cirio que pidio pensión por separarse 50 millones de dólares. VAMOSS la gente no es boluda y si cayo el gato ese por que uno tenian que matar y eligieron al político',\n",
+ " 'Navorro pobre idiota te qedaste sin sobre y estás looooKaaaa ...noooo ???',\n",
+ " 'quien es la gorda torta que es obvio que el tio la violo ?',\n",
+ " 'Si tan desagradable te resulta para que lo miras? O trabajas de trol?',\n",
+ " 'Cristina Pérez está vetada?? Si el novio ya perdió.. saquenla del freezer cagones',\n",
+ " 'Cómo te duele la cola ,el leoncito te la puso .',\n",
+ " 'CompuTrabajo\\nBumeran \\nZona Jobs. \\n\\nTe paso algunas páginas para buscar laburo .\\n\\nJAJAJAJAKA TE QUERES MATAR FRACATELLI',\n",
+ " 'Chupate una pija curroteli. Ahora vas a trabajar rata!!',\n",
+ " 'Che Branca....que pachoooo? Gano el leon??? No era q se bajaba? Ahajajaja ratas asquerosas...PERDIERON..RATAS ASQUEROSAS...',\n",
+ " 'Con el culo roto diría yo.',\n",
+ " 'Estás con la cola hecha ???? Nos encantan puta del estado',\n",
+ " 'Ya ganó, de que vas a laburar ahora bolsa de estiércol?',\n",
+ " 'Se te acabó el currito.... anda a cuna a laburara de mucamo en un hotel.',\n",
+ " 'Branca.......vete al coño',\n",
+ " 'Ya ganaron salame. Queres un pañuelo? Vas a necesitar 4 años de carilina gilastrun',\n",
+ " 'cómo te tiene que estar doliendo la cola branca jajaja empezá a gozar!!',\n",
+ " 'Te entró entera y sin lubricante',\n",
+ " 'Peor que las Putas sos..',\n",
+ " 'Y qué poronga te importa a dónde sale? Qué tenés celos o te arde el culo que él si tiene vida social y vos sos un parásito chupa sangre? Pedazo de bolsa de semen.',\n",
+ " 'Y cuál sería tu pelo en el culo ?',\n",
+ " 'Vos cerra el ojete, chupa culo de la chorra y andate a la reMiami que te pario que a ti te gusta.',\n",
+ " 'Pone la parte donde termina la obra y ellos se sacan fotos con las personas que si valen la pena, los negros siempre tratando de arruinar las cosas, chúpate tres baldes de chotas brancatelli mufasa',\n",
+ " 'Que retardado sos, payaso, tenes todo en contra una prosti de mujer, hijos feos y vos un pelotudo',\n",
+ " 'Por si o por no, vas a seguir chupando culos?',\n",
+ " 'Que berreta sos! Pensando diferente a ellos! Vos estás usando a una mujer! Generar bardo',\n",
+ " 'Vos entendès bien lo que es salir a cualquier lado y que te caguen a puteadas, sabès bien que eran 5 locas. Vos si sos puteable al cubo',\n",
+ " 'a vos te patea hasta tu mujer nardo de cuarta',\n",
+ " 'Gordo cornudo, chupa pijas k, espero tengas el pasaporte al día…. Hablando de putas y cornudos: ya hiciste el ADN de tus crías?',\n",
+ " 'Escóndete ahora rata askerosa',\n",
+ " 'Una girada gordo eso, te queres matar, se te acaba el sobre',\n",
+ " 'Como te quedó la cola????',\n",
+ " 'Chupame la pija bien chupada',\n",
+ " 'Insoportable el marido de.',\n",
+ " 'Métanse la limada en el medio del ogt, @ertenembaum',\n",
+ " 'Mas temprano arrancaron las Lanatitas con la limada sutil',\n",
+ " 'Que se puede esperar de un p3dofilo mas que una manoseada?',\n",
+ " 'Compitiendo en el desafío de culorroto']"
+ ]
+ },
+ "execution_count": 6,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
"source": [
- "filtered_df.to_csv('../data/raw/datos_etiquetados.csv', index=False)"
+ "women_h_df = df.loc[(df['women'] == 1) & (df['journalist_genre'] == 'H')]\n",
+ "women_h_text = women_h_df['text'].to_list()\n",
+ "women_h_text"
]
}
],
@@ -157,7 +1141,7 @@
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
- "version": "3.11.4"
+ "version": "3.11.7"
}
},
"nbformat": 4,
diff --git a/_notebooks/1.3-analyze.ipynb b/_notebooks/1.3-analyze.ipynb
index 60f565e..3e4aaef 100644
--- a/_notebooks/1.3-analyze.ipynb
+++ b/_notebooks/1.3-analyze.ipynb
@@ -2,992 +2,149 @@
"cells": [
{
"cell_type": "code",
- "execution_count": 62,
+ "execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd\n",
- "import numpy as np"
+ "import nltk\n",
+ "from nltk.collocations import BigramCollocationFinder\n",
+ "from nltk.metrics import BigramAssocMeasures\n",
+ "from nltk.collocations import TrigramCollocationFinder\n",
+ "from nltk.metrics import TrigramAssocMeasures"
]
},
{
"cell_type": "code",
- "execution_count": 63,
+ "execution_count": 2,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
- "52476\n"
+ "(55374, 22)\n"
]
- },
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " tweet_id | \n",
- " username | \n",
- " url | \n",
- " text | \n",
- " image | \n",
- " video | \n",
- " date | \n",
- " reply | \n",
- " retweet | \n",
- " like | \n",
- " ... | \n",
- " is_rt | \n",
- " rt_by | \n",
- " raw | \n",
- " query_type | \n",
- " scraped_at | \n",
- " event | \n",
- " date_cleansed | \n",
- " date_local | \n",
- " dt_date | \n",
- " label | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1708973726455181497 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17089737264... | \n",
- " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T22:34:22+00:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 17 | \n",
- " ... | \n",
- " False | \n",
- " NaN | \n",
- " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
- " from: @soyingridbeck | \n",
- " 2023-10-10T17:43:36.448550+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 22:34:22+00:00 | \n",
- " 2023-10-02 19:34:22-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1708809681924243938 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17088096819... | \n",
- " ¿Irse a Marbella en un yate de lujo? | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:42:30+00:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0 | \n",
- " ... | \n",
- " False | \n",
- " NaN | \n",
- " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
- " from: @soyingridbeck | \n",
- " 2023-10-10T17:43:36.612322+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 11:42:30+00:00 | \n",
- " 2023-10-02 08:42:30-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1708810804101853498 | \n",
- " @kgalperin | \n",
- " https://x.com/kgalperin/status/170881080410185... | \n",
- " Me asombra esa interpretación, q expresa muy b... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:46:58+00:00 | \n",
- " 0 | \n",
- " 0 | \n",
- " 1 | \n",
- " ... | \n",
- " False | \n",
- " NaN | \n",
- " {'html_tweet': 'Karina Galperin@kgalperin·Oct ... | \n",
- " to: @soyingridbeck | \n",
- " 2023-10-10T18:22:43.429345+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 11:46:58+00:00 | \n",
- " 2023-10-02 08:46:58-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- "
\n",
- " \n",
- "
\n",
- "
3 rows × 23 columns
\n",
- "
"
- ],
- "text/plain": [
- " tweet_id username \\\n",
- "0 1708973726455181497 @soyingridbeck \n",
- "1 1708809681924243938 @soyingridbeck \n",
- "2 1708810804101853498 @kgalperin \n",
- "\n",
- " url \\\n",
- "0 https://x.com/soyingridbeck/status/17089737264... \n",
- "1 https://x.com/soyingridbeck/status/17088096819... \n",
- "2 https://x.com/kgalperin/status/170881080410185... \n",
- "\n",
- " text image video \\\n",
- "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
- "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
- "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
- "\n",
- " date reply retweet like ... is_rt rt_by \\\n",
- "0 2023-10-02T22:34:22+00:00 0 3 17 ... False NaN \n",
- "1 2023-10-02T11:42:30+00:00 1 0 0 ... False NaN \n",
- "2 2023-10-02T11:46:58+00:00 0 0 1 ... False NaN \n",
- "\n",
- " raw query_type \\\n",
- "0 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
- "1 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
- "2 {'html_tweet': 'Karina Galperin@kgalperin·Oct ... to: @soyingridbeck \n",
- "\n",
- " scraped_at event date_cleansed \\\n",
- "0 2023-10-10T17:43:36.448550+00:00 1er debate 2023-10-02 22:34:22+00:00 \n",
- "1 2023-10-10T17:43:36.612322+00:00 1er debate 2023-10-02 11:42:30+00:00 \n",
- "2 2023-10-10T18:22:43.429345+00:00 1er debate 2023-10-02 11:46:58+00:00 \n",
- "\n",
- " date_local dt_date label \n",
- "0 2023-10-02 19:34:22-03:00 2023-10-02 [] \n",
- "1 2023-10-02 08:42:30-03:00 2023-10-02 [] \n",
- "2 2023-10-02 08:46:58-03:00 2023-10-02 [] \n",
- "\n",
- "[3 rows x 23 columns]"
- ]
- },
- "execution_count": 63,
- "metadata": {},
- "output_type": "execute_result"
}
],
"source": [
- "df = pd.read_csv('../data/raw/datos_etiquetados.csv')\n",
- "print(len(df))\n",
- "df.head(3)"
+ "# Read the DataFrame with the tweet text\n",
+ "df = pd.read_csv(\"../data/raw/elecciones_argentina.csv\")\n",
+ "print(df.shape)"
]
},
{
"cell_type": "code",
- "execution_count": 64,
+ "execution_count": 3,
"metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " tweet_id | \n",
- " username | \n",
- " url | \n",
- " text | \n",
- " image | \n",
- " video | \n",
- " date | \n",
- " reply | \n",
- " retweet | \n",
- " like | \n",
- " ... | \n",
- " rt_by | \n",
- " raw | \n",
- " query_type | \n",
- " scraped_at | \n",
- " event | \n",
- " date_cleansed | \n",
- " date_local | \n",
- " dt_date | \n",
- " label | \n",
- " journalist_username | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1708973726455181497 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17089737264... | \n",
- " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T22:34:22+00:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 17 | \n",
- " ... | \n",
- " NaN | \n",
- " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
- " from: @soyingridbeck | \n",
- " 2023-10-10T17:43:36.448550+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 22:34:22+00:00 | \n",
- " 2023-10-02 19:34:22-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- " @soyingridbeck | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1708809681924243938 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17088096819... | \n",
- " ¿Irse a Marbella en un yate de lujo? | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:42:30+00:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0 | \n",
- " ... | \n",
- " NaN | \n",
- " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
- " from: @soyingridbeck | \n",
- " 2023-10-10T17:43:36.612322+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 11:42:30+00:00 | \n",
- " 2023-10-02 08:42:30-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- " @soyingridbeck | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1708810804101853498 | \n",
- " @kgalperin | \n",
- " https://x.com/kgalperin/status/170881080410185... | \n",
- " Me asombra esa interpretación, q expresa muy b... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:46:58+00:00 | \n",
- " 0 | \n",
- " 0 | \n",
- " 1 | \n",
- " ... | \n",
- " NaN | \n",
- " {'html_tweet': 'Karina Galperin@kgalperin·Oct ... | \n",
- " to: @soyingridbeck | \n",
- " 2023-10-10T18:22:43.429345+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 11:46:58+00:00 | \n",
- " 2023-10-02 08:46:58-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- " @soyingridbeck | \n",
- "
\n",
- " \n",
- "
\n",
- "
3 rows × 24 columns
\n",
- "
"
- ],
- "text/plain": [
- " tweet_id username \\\n",
- "0 1708973726455181497 @soyingridbeck \n",
- "1 1708809681924243938 @soyingridbeck \n",
- "2 1708810804101853498 @kgalperin \n",
- "\n",
- " url \\\n",
- "0 https://x.com/soyingridbeck/status/17089737264... \n",
- "1 https://x.com/soyingridbeck/status/17088096819... \n",
- "2 https://x.com/kgalperin/status/170881080410185... \n",
- "\n",
- " text image video \\\n",
- "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
- "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
- "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
- "\n",
- " date reply retweet like ... rt_by \\\n",
- "0 2023-10-02T22:34:22+00:00 0 3 17 ... NaN \n",
- "1 2023-10-02T11:42:30+00:00 1 0 0 ... NaN \n",
- "2 2023-10-02T11:46:58+00:00 0 0 1 ... NaN \n",
- "\n",
- " raw query_type \\\n",
- "0 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
- "1 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
- "2 {'html_tweet': 'Karina Galperin@kgalperin·Oct ... to: @soyingridbeck \n",
- "\n",
- " scraped_at event date_cleansed \\\n",
- "0 2023-10-10T17:43:36.448550+00:00 1er debate 2023-10-02 22:34:22+00:00 \n",
- "1 2023-10-10T17:43:36.612322+00:00 1er debate 2023-10-02 11:42:30+00:00 \n",
- "2 2023-10-10T18:22:43.429345+00:00 1er debate 2023-10-02 11:46:58+00:00 \n",
- "\n",
- " date_local dt_date label journalist_username \n",
- "0 2023-10-02 19:34:22-03:00 2023-10-02 [] @soyingridbeck \n",
- "1 2023-10-02 08:42:30-03:00 2023-10-02 [] @soyingridbeck \n",
- "2 2023-10-02 08:46:58-03:00 2023-10-02 [] @soyingridbeck \n",
- "\n",
- "[3 rows x 24 columns]"
- ]
- },
- "execution_count": 64,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
+ "outputs": [],
"source": [
- "df['journalist_username'] = df['query_type'].str.extract(r'(@\\w+)')\n",
- "df.head(3)\n"
+ "# Tokenize the tweet text\n",
+ "tokenizer = nltk.tokenize.RegexpTokenizer(r'\\w+')\n",
+ "df['tokens'] = df['text'].apply(lambda x: tokenizer.tokenize(str(x).lower()))\n",
+ "tokens = df['tokens']"
]
},
{
"cell_type": "code",
- "execution_count": 65,
+ "execution_count": 4,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
- "Mujeres periodistas: 34\n",
- "Hombres periodistas: 20\n"
+ "('de', 'periodista') 62\n",
+ "('sos', 'periodista') 54\n",
+ "('periodista', 'de') 49\n",
+ "('un', 'periodista') 47\n",
+ "('periodista', 'independiente') 45\n",
+ "('el', 'periodista') 43\n",
+ "('como', 'periodista') 40\n",
+ "('periodista', 'que') 33\n",
+ "('la', 'periodista') 30\n",
+ "('periodista', 'y') 28\n",
+ "('una', 'periodista') 22\n",
+ "('periodista', 'sos') 21\n",
+ "('es', 'periodista') 20\n",
+ "('gran', 'periodista') 17\n",
+ "('periodista', 'no') 13\n",
+ "('ser', 'periodista') 12\n",
+ "('periodista', 'militante') 12\n",
+ "('mejor', 'periodista') 11\n",
+ "('periodista', 'crítico') 11\n",
+ "('periodista', 'pero') 10\n"
]
- },
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " tweet_id | \n",
- " username | \n",
- " url | \n",
- " text | \n",
- " image | \n",
- " video | \n",
- " date | \n",
- " reply | \n",
- " retweet | \n",
- " like | \n",
- " ... | \n",
- " raw | \n",
- " query_type | \n",
- " scraped_at | \n",
- " event | \n",
- " date_cleansed | \n",
- " date_local | \n",
- " dt_date | \n",
- " label | \n",
- " journalist_username | \n",
- " journalist_genre | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1708973726455181497 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17089737264... | \n",
- " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T22:34:22+00:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 17 | \n",
- " ... | \n",
- " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
- " from: @soyingridbeck | \n",
- " 2023-10-10T17:43:36.448550+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 22:34:22+00:00 | \n",
- " 2023-10-02 19:34:22-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- " @soyingridbeck | \n",
- " M | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1708809681924243938 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17088096819... | \n",
- " ¿Irse a Marbella en un yate de lujo? | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:42:30+00:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0 | \n",
- " ... | \n",
- " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
- " from: @soyingridbeck | \n",
- " 2023-10-10T17:43:36.612322+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 11:42:30+00:00 | \n",
- " 2023-10-02 08:42:30-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- " @soyingridbeck | \n",
- " M | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1708810804101853498 | \n",
- " @kgalperin | \n",
- " https://x.com/kgalperin/status/170881080410185... | \n",
- " Me asombra esa interpretación, q expresa muy b... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:46:58+00:00 | \n",
- " 0 | \n",
- " 0 | \n",
- " 1 | \n",
- " ... | \n",
- " {'html_tweet': 'Karina Galperin@kgalperin·Oct ... | \n",
- " to: @soyingridbeck | \n",
- " 2023-10-10T18:22:43.429345+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 11:46:58+00:00 | \n",
- " 2023-10-02 08:46:58-03:00 | \n",
- " 2023-10-02 | \n",
- " [] | \n",
- " @soyingridbeck | \n",
- " M | \n",
- "
\n",
- " \n",
- "
\n",
- "
3 rows × 25 columns
\n",
- "
"
- ],
- "text/plain": [
- " tweet_id username \\\n",
- "0 1708973726455181497 @soyingridbeck \n",
- "1 1708809681924243938 @soyingridbeck \n",
- "2 1708810804101853498 @kgalperin \n",
- "\n",
- " url \\\n",
- "0 https://x.com/soyingridbeck/status/17089737264... \n",
- "1 https://x.com/soyingridbeck/status/17088096819... \n",
- "2 https://x.com/kgalperin/status/170881080410185... \n",
- "\n",
- " text image video \\\n",
- "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
- "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
- "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
- "\n",
- " date reply retweet like ... \\\n",
- "0 2023-10-02T22:34:22+00:00 0 3 17 ... \n",
- "1 2023-10-02T11:42:30+00:00 1 0 0 ... \n",
- "2 2023-10-02T11:46:58+00:00 0 0 1 ... \n",
- "\n",
- " raw query_type \\\n",
- "0 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
- "1 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
- "2 {'html_tweet': 'Karina Galperin@kgalperin·Oct ... to: @soyingridbeck \n",
- "\n",
- " scraped_at event date_cleansed \\\n",
- "0 2023-10-10T17:43:36.448550+00:00 1er debate 2023-10-02 22:34:22+00:00 \n",
- "1 2023-10-10T17:43:36.612322+00:00 1er debate 2023-10-02 11:42:30+00:00 \n",
- "2 2023-10-10T18:22:43.429345+00:00 1er debate 2023-10-02 11:46:58+00:00 \n",
- "\n",
- " date_local dt_date label journalist_username \\\n",
- "0 2023-10-02 19:34:22-03:00 2023-10-02 [] @soyingridbeck \n",
- "1 2023-10-02 08:42:30-03:00 2023-10-02 [] @soyingridbeck \n",
- "2 2023-10-02 08:46:58-03:00 2023-10-02 [] @soyingridbeck \n",
- "\n",
- " journalist_genre \n",
- "0 M \n",
- "1 M \n",
- "2 M \n",
- "\n",
- "[3 rows x 25 columns]"
- ]
- },
- "execution_count": 65,
- "metadata": {},
- "output_type": "execute_result"
}
],
"source": [
- "mujeres = ['@Miglesias71', '@gabipellegrini3', '@GabrielaWeller',\n",
- " '@SanchezClarise', '@soyingridbeck', '@SilvinaMolina',\n",
- " '@mafito11', '@AJuliaLopez', '@Cris_noticias',\n",
- " '@vivicanosaok', '@marialauratv', '@guadavazquez',\n",
- " '@odonnellmaria', '@mjolivan', '@maclorena',\n",
- " '@rominamanguel', '@monigps', '@lucianageuna',\n",
- " '@negropolisok', '@juliamengo', '@FlorHalfon',\n",
- " '@cyngarciaradio', '@deboraplager', '@silviafbarrio',\n",
- " '@NANCYPAZOS', '@gabycociffi', '@SoleVallejos',\n",
- " '@nbg__', '@hindelita', '@MercedesFunes',\n",
- " '@anaecorrea', '@Marcelitaojeda', '@lucianapeker',\n",
- " '@Angelalerena']\n",
- "\n",
- "hombres = ['@rialjorge', '@fantinofantino', '@andykusnetzoff',\n",
- " '@SANTIAGODELMORO', '@VHMok', '@wwnicolas',\n",
- " '@edufeiok', '@luisnovaresio', '@JonatanViale',\n",
- " '@majulluis', '@barilirodolfo', '@diegoleuco',\n",
- " '@alfleuco', '@Gatosylvestre', '@robdnavarro',\n",
- " '@Sietecase', '@aleberco', '@diegobranca',\n",
- " '@ischargro', '@ertenembaum']\n",
+ "# Find collocations with 'periodista' for each tweet\n",
+ "collocations = []\n",
+ "for tweet_tokens in tokens:\n",
+ " finder = BigramCollocationFinder.from_words(tweet_tokens)\n",
+ " tweet_collocations = finder.nbest(BigramAssocMeasures().raw_freq, 20)\n",
+ " collocations.extend(tweet_collocations)\n",
"\n",
- "print(f'Mujeres periodistas: {len(mujeres)}\\nHombres periodistas: {len(hombres)}')\n",
+ "# Filter collocations that contain 'periodista'\n",
+ "periodista_collocations = [col for col in collocations if 'periodista' in col]\n",
"\n",
- "# Check if any element from the lists is present in the 'query_type' column\n",
- "df['journalist_genre'] = ''\n",
- "df.loc[df['query_type'].str.contains('|'.join(mujeres)), 'journalist_genre'] = 'M'\n",
- "df.loc[df['query_type'].str.contains('|'.join(hombres)), 'journalist_genre'] = 'H'\n",
+ "# Count the occurrences of each collocation\n",
+ "collocation_counts = nltk.FreqDist(periodista_collocations)\n",
"\n",
- "df.head(3)"
+ "# Print the collocations and their counts\n",
+ "for collocation, count in collocation_counts.most_common(20):\n",
+ " print(collocation, count)\n"
]
},
{
"cell_type": "code",
- "execution_count": 66,
+ "execution_count": 5,
"metadata": {},
"outputs": [
{
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " tweet_id | \n",
- " username | \n",
- " url | \n",
- " text | \n",
- " image | \n",
- " video | \n",
- " date | \n",
- " reply | \n",
- " retweet | \n",
- " like | \n",
- " ... | \n",
- " raw | \n",
- " query_type | \n",
- " scraped_at | \n",
- " event | \n",
- " date_cleansed | \n",
- " date_local | \n",
- " dt_date | \n",
- " label | \n",
- " journalist_username | \n",
- " journalist_genre | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1708973726455181497 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17089737264... | \n",
- " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T22:34:22+00:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 17 | \n",
- " ... | \n",
- " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
- " from: @soyingridbeck | \n",
- " 2023-10-10T17:43:36.448550+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 22:34:22+00:00 | \n",
- " 2023-10-02 19:34:22-03:00 | \n",
- " 2023-10-02 | \n",
- " | \n",
- " @soyingridbeck | \n",
- " M | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1708809681924243938 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17088096819... | \n",
- " ¿Irse a Marbella en un yate de lujo? | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:42:30+00:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0 | \n",
- " ... | \n",
- " {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... | \n",
- " from: @soyingridbeck | \n",
- " 2023-10-10T17:43:36.612322+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 11:42:30+00:00 | \n",
- " 2023-10-02 08:42:30-03:00 | \n",
- " 2023-10-02 | \n",
- " | \n",
- " @soyingridbeck | \n",
- " M | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1708810804101853498 | \n",
- " @kgalperin | \n",
- " https://x.com/kgalperin/status/170881080410185... | \n",
- " Me asombra esa interpretación, q expresa muy b... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:46:58+00:00 | \n",
- " 0 | \n",
- " 0 | \n",
- " 1 | \n",
- " ... | \n",
- " {'html_tweet': 'Karina Galperin@kgalperin·Oct ... | \n",
- " to: @soyingridbeck | \n",
- " 2023-10-10T18:22:43.429345+00:00 | \n",
- " 1er debate | \n",
- " 2023-10-02 11:46:58+00:00 | \n",
- " 2023-10-02 08:46:58-03:00 | \n",
- " 2023-10-02 | \n",
- " | \n",
- " @soyingridbeck | \n",
- " M | \n",
- "
\n",
- " \n",
- "
\n",
- "
3 rows × 25 columns
\n",
- "
"
- ],
- "text/plain": [
- " tweet_id username \\\n",
- "0 1708973726455181497 @soyingridbeck \n",
- "1 1708809681924243938 @soyingridbeck \n",
- "2 1708810804101853498 @kgalperin \n",
- "\n",
- " url \\\n",
- "0 https://x.com/soyingridbeck/status/17089737264... \n",
- "1 https://x.com/soyingridbeck/status/17088096819... \n",
- "2 https://x.com/kgalperin/status/170881080410185... \n",
- "\n",
- " text image video \\\n",
- "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
- "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
- "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
- "\n",
- " date reply retweet like ... \\\n",
- "0 2023-10-02T22:34:22+00:00 0 3 17 ... \n",
- "1 2023-10-02T11:42:30+00:00 1 0 0 ... \n",
- "2 2023-10-02T11:46:58+00:00 0 0 1 ... \n",
- "\n",
- " raw query_type \\\n",
- "0 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
- "1 {'html_tweet': '𝗜𝗻𝗴𝗿𝗶𝗱 𝗕𝗲𝗰𝗸 @soyingridbeck·Oct... from: @soyingridbeck \n",
- "2 {'html_tweet': 'Karina Galperin@kgalperin·Oct ... to: @soyingridbeck \n",
- "\n",
- " scraped_at event date_cleansed \\\n",
- "0 2023-10-10T17:43:36.448550+00:00 1er debate 2023-10-02 22:34:22+00:00 \n",
- "1 2023-10-10T17:43:36.612322+00:00 1er debate 2023-10-02 11:42:30+00:00 \n",
- "2 2023-10-10T18:22:43.429345+00:00 1er debate 2023-10-02 11:46:58+00:00 \n",
- "\n",
- " date_local dt_date label journalist_username \\\n",
- "0 2023-10-02 19:34:22-03:00 2023-10-02 @soyingridbeck \n",
- "1 2023-10-02 08:42:30-03:00 2023-10-02 @soyingridbeck \n",
- "2 2023-10-02 08:46:58-03:00 2023-10-02 @soyingridbeck \n",
- "\n",
- " journalist_genre \n",
- "0 M \n",
- "1 M \n",
- "2 M \n",
- "\n",
- "[3 rows x 25 columns]"
- ]
- },
- "execution_count": 66,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "df['label'] = df['label'].replace(\"[]\", '')\n",
- "\n",
- "df.head(3)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 68,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- " 48581\n",
- "WOMEN 1269\n",
- "POLITICS 1155\n",
- "APPEARANCE 1112\n",
- "DISABLED 335\n",
- "RACISM 214\n",
- "CLASS 149\n",
- "LGBTI 128\n",
- "CRIMINAL 49\n",
- "CALLS 45\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 68,
- "metadata": {},
- "output_type": "execute_result"
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "('no', 'sos', 'periodista') 16\n",
+ "('a', 'un', 'periodista') 12\n",
+ "('vos', 'sos', 'periodista') 12\n",
+ "('periodista', 'de', 'verdad') 11\n",
+ "('un', 'periodista', 'de') 9\n",
+ "('que', 'sos', 'periodista') 8\n",
+ "('sos', 'un', 'periodista') 8\n",
+ "('no', 'es', 'periodista') 7\n",
+ "('la', 'periodista', 'que') 7\n",
+ "('a', 'una', 'periodista') 7\n",
+ "('sos', 'periodista', 'sos') 7\n",
+ "('que', 'seas', 'periodista') 6\n",
+ "('un', 'gran', 'periodista') 6\n",
+ "('de', 'ser', 'periodista') 6\n",
+ "('periodista', 'sos', 'un') 6\n",
+ "('sos', 'una', 'periodista') 6\n",
+ "('es', 'periodista', 'es') 5\n",
+ "('un', 'periodista', 'independiente') 5\n",
+ "('de', 'un', 'periodista') 5\n",
+ "('la', 'periodista', 'independiente') 5\n"
+ ]
}
],
"source": [
- "df['label'] = df['label'].str.replace(\"[\\'\\[\\]]\", '', regex=True)\n",
+ "# Find collocations with 'periodista' for each tweet and count them\n",
+ "collocations = []\n",
+ "for tweet_tokens in tokens:\n",
+ " finder = TrigramCollocationFinder.from_words(tweet_tokens)\n",
+ " tweet_collocations = finder.nbest(TrigramAssocMeasures().raw_freq, 20)\n",
+ " collocations.extend(tweet_collocations)\n",
"\n",
- "labels = df['label'].to_list()\n",
+ "# Filter collocations that contain 'periodista'\n",
+ "periodista_collocations = [col for col in collocations if 'periodista' in col]\n",
"\n",
- "labels = [x.split(',') for x in labels]\n",
+ "# Count the occurrences of each collocation\n",
+ "collocation_counts = nltk.FreqDist(periodista_collocations)\n",
"\n",
- "labels = [item for sublist in labels for item in sublist]\n",
- "\n",
- "labels = [x.lstrip() for x in labels]\n",
- "\n",
- "labels_count = pd.Series(labels).value_counts()\n",
- "\n",
- "labels_count"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 69,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " tweet_id | \n",
- " username | \n",
- " url | \n",
- " text | \n",
- " image | \n",
- " video | \n",
- " date | \n",
- " reply | \n",
- " retweet | \n",
- " like | \n",
- " ... | \n",
- " journalist_genre | \n",
- " women | \n",
- " politics | \n",
- " appearance | \n",
- " disabled | \n",
- " racism | \n",
- " class | \n",
- " lgbti | \n",
- " criminal | \n",
- " calls | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1708973726455181497 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17089737264... | \n",
- " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T22:34:22+00:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 17 | \n",
- " ... | \n",
- " M | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1708809681924243938 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17088096819... | \n",
- " ¿Irse a Marbella en un yate de lujo? | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:42:30+00:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0 | \n",
- " ... | \n",
- " M | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1708810804101853498 | \n",
- " @kgalperin | \n",
- " https://x.com/kgalperin/status/170881080410185... | \n",
- " Me asombra esa interpretación, q expresa muy b... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:46:58+00:00 | \n",
- " 0 | \n",
- " 0 | \n",
- " 1 | \n",
- " ... | \n",
- " M | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- "
\n",
- " \n",
- "
\n",
- "
3 rows × 34 columns
\n",
- "
"
- ],
- "text/plain": [
- " tweet_id username \\\n",
- "0 1708973726455181497 @soyingridbeck \n",
- "1 1708809681924243938 @soyingridbeck \n",
- "2 1708810804101853498 @kgalperin \n",
- "\n",
- " url \\\n",
- "0 https://x.com/soyingridbeck/status/17089737264... \n",
- "1 https://x.com/soyingridbeck/status/17088096819... \n",
- "2 https://x.com/kgalperin/status/170881080410185... \n",
- "\n",
- " text image video \\\n",
- "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
- "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
- "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
- "\n",
- " date reply retweet like ... journalist_genre \\\n",
- "0 2023-10-02T22:34:22+00:00 0 3 17 ... M \n",
- "1 2023-10-02T11:42:30+00:00 1 0 0 ... M \n",
- "2 2023-10-02T11:46:58+00:00 0 0 1 ... M \n",
- "\n",
- " women politics appearance disabled racism class lgbti criminal calls \n",
- "0 0 0 0 0 0 0 0 0 0 \n",
- "1 0 0 0 0 0 0 0 0 0 \n",
- "2 0 0 0 0 0 0 0 0 0 \n",
- "\n",
- "[3 rows x 34 columns]"
- ]
- },
- "execution_count": 69,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# Assuming your DataFrame is named 'filtered_df'\n",
- "labels = ['women', 'politics', 'appearance', 'disabled', 'racism', 'class', 'lgbti', 'criminal', 'calls']\n",
- "\n",
- "for label in labels:\n",
- " df[label] = df['label'].str.contains(label, case=False).astype(int)\n",
- "\n",
- "df.head(3)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 70,
- "metadata": {},
- "outputs": [],
- "source": [
- "df.to_csv('../data/processed/elecciones_argentina.csv', index=False)"
+ "# Print the collocations and their counts\n",
+ "for collocation, count in collocation_counts.most_common(20):\n",
+ " print(collocation, count)\n"
]
}
],
diff --git a/_notebooks/1.4-analyze.ipynb b/_notebooks/1.4-analyze.ipynb
deleted file mode 100644
index 536ae75..0000000
--- a/_notebooks/1.4-analyze.ipynb
+++ /dev/null
@@ -1,1149 +0,0 @@
-{
- "cells": [
- {
- "cell_type": "code",
- "execution_count": 7,
- "metadata": {},
- "outputs": [],
- "source": [
- "import pandas as pd\n",
- "import numpy as np"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 8,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " tweet_id | \n",
- " username | \n",
- " url | \n",
- " text | \n",
- " image | \n",
- " video | \n",
- " date | \n",
- " reply | \n",
- " retweet | \n",
- " like | \n",
- " ... | \n",
- " journalist_genre | \n",
- " women | \n",
- " politics | \n",
- " appearance | \n",
- " disabled | \n",
- " racism | \n",
- " class | \n",
- " lgbti | \n",
- " criminal | \n",
- " calls | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1708973726455181497 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17089737264... | \n",
- " Sólo @SergioMassa y @myriambregman abordaron a... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T22:34:22+00:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 17 | \n",
- " ... | \n",
- " M | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1708809681924243938 | \n",
- " @soyingridbeck | \n",
- " https://x.com/soyingridbeck/status/17088096819... | \n",
- " ¿Irse a Marbella en un yate de lujo? | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:42:30+00:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0 | \n",
- " ... | \n",
- " M | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1708810804101853498 | \n",
- " @kgalperin | \n",
- " https://x.com/kgalperin/status/170881080410185... | \n",
- " Me asombra esa interpretación, q expresa muy b... | \n",
- " NaN | \n",
- " NaN | \n",
- " 2023-10-02T11:46:58+00:00 | \n",
- " 0 | \n",
- " 0 | \n",
- " 1 | \n",
- " ... | \n",
- " M | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- " 0 | \n",
- "
\n",
- " \n",
- "
\n",
- "
3 rows × 34 columns
\n",
- "
"
- ],
- "text/plain": [
- " tweet_id username \\\n",
- "0 1708973726455181497 @soyingridbeck \n",
- "1 1708809681924243938 @soyingridbeck \n",
- "2 1708810804101853498 @kgalperin \n",
- "\n",
- " url \\\n",
- "0 https://x.com/soyingridbeck/status/17089737264... \n",
- "1 https://x.com/soyingridbeck/status/17088096819... \n",
- "2 https://x.com/kgalperin/status/170881080410185... \n",
- "\n",
- " text image video \\\n",
- "0 Sólo @SergioMassa y @myriambregman abordaron a... NaN NaN \n",
- "1 ¿Irse a Marbella en un yate de lujo? NaN NaN \n",
- "2 Me asombra esa interpretación, q expresa muy b... NaN NaN \n",
- "\n",
- " date reply retweet like ... journalist_genre \\\n",
- "0 2023-10-02T22:34:22+00:00 0 3 17 ... M \n",
- "1 2023-10-02T11:42:30+00:00 1 0 0 ... M \n",
- "2 2023-10-02T11:46:58+00:00 0 0 1 ... M \n",
- "\n",
- " women politics appearance disabled racism class lgbti criminal calls \n",
- "0 0 0 0 0 0 0 0 0 0 \n",
- "1 0 0 0 0 0 0 0 0 0 \n",
- "2 0 0 0 0 0 0 0 0 0 \n",
- "\n",
- "[3 rows x 34 columns]"
- ]
- },
- "execution_count": 8,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "df = pd.read_csv('../data/processed/elecciones_argentina.csv')\n",
- "df.head(3)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 11,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@Angelalerena 169\n",
- "@Cris_noticias 128\n",
- "@odonnellmaria 107\n",
- "@JonatanViale 101\n",
- "@edufeiok 100\n",
- "@vivicanosaok 81\n",
- "@guadavazquez 66\n",
- "@diegobranca 66\n",
- "@rialjorge 66\n",
- "@NANCYPAZOS 49\n",
- "@Gatosylvestre 35\n",
- "@robdnavarro 31\n",
- "@luisnovaresio 29\n",
- "@fantinofantino 26\n",
- "@rominamanguel 25\n",
- "@cyngarciaradio 24\n",
- "@majulluis 21\n",
- "@marialauratv 21\n",
- "@mjolivan 19\n",
- "@lucianageuna 19\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 11,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "women_df = df[df['women'] == 1]\n",
- "\n",
- "women_df['journalist_username'].value_counts().head(20)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 12,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@diegobranca 136\n",
- "@odonnellmaria 114\n",
- "@Angelalerena 113\n",
- "@Cris_noticias 92\n",
- "@edufeiok 91\n",
- "@robdnavarro 80\n",
- "@rialjorge 71\n",
- "@luisnovaresio 65\n",
- "@JonatanViale 54\n",
- "@Gatosylvestre 37\n",
- "@nbg__ 29\n",
- "@cyngarciaradio 27\n",
- "@vivicanosaok 26\n",
- "@mjolivan 25\n",
- "@majulluis 24\n",
- "@guadavazquez 21\n",
- "@lucianageuna 17\n",
- "@NANCYPAZOS 16\n",
- "@ischargro 16\n",
- "@fantinofantino 14\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 12,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "politics_df = df[df['politics'] == 1]\n",
- "\n",
- "politics_df['journalist_username'].value_counts().head(20)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 13,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@JonatanViale 247\n",
- "@diegobranca 213\n",
- "@edufeiok 87\n",
- "@rialjorge 82\n",
- "@Angelalerena 58\n",
- "@odonnellmaria 51\n",
- "@robdnavarro 47\n",
- "@Cris_noticias 45\n",
- "@vivicanosaok 37\n",
- "@majulluis 35\n",
- "@luisnovaresio 22\n",
- "@cyngarciaradio 22\n",
- "@mjolivan 20\n",
- "@guadavazquez 16\n",
- "@fantinofantino 15\n",
- "@Gatosylvestre 14\n",
- "@lucianageuna 13\n",
- "@nbg__ 10\n",
- "@ischargro 10\n",
- "@juliamengo 10\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 13,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "appearance_df = df[df['appearance'] == 1]\n",
- "\n",
- "appearance_df['journalist_username'].value_counts().head(20)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 14,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@guadavazquez 48\n",
- "@edufeiok 43\n",
- "@rialjorge 29\n",
- "@diegobranca 24\n",
- "@JonatanViale 22\n",
- "@vivicanosaok 19\n",
- "@Cris_noticias 19\n",
- "@odonnellmaria 17\n",
- "@majulluis 17\n",
- "@fantinofantino 12\n",
- "@robdnavarro 11\n",
- "@luisnovaresio 9\n",
- "@rominamanguel 8\n",
- "@Angelalerena 7\n",
- "@ischargro 7\n",
- "@juliamengo 5\n",
- "@nbg__ 5\n",
- "@cyngarciaradio 5\n",
- "@marialauratv 4\n",
- "@NANCYPAZOS 4\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 14,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "disabled_df = df[df['disabled'] == 1]\n",
- "\n",
- "disabled_df['journalist_username'].value_counts().head(20)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 15,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@edufeiok 32\n",
- "@rominamanguel 21\n",
- "@JonatanViale 20\n",
- "@diegobranca 19\n",
- "@Cris_noticias 17\n",
- "@robdnavarro 14\n",
- "@rialjorge 11\n",
- "@Angelalerena 10\n",
- "@negropolisok 9\n",
- "@luisnovaresio 9\n",
- "@odonnellmaria 8\n",
- "@Gatosylvestre 6\n",
- "@guadavazquez 5\n",
- "@anaecorrea 5\n",
- "@vivicanosaok 4\n",
- "@mjolivan 3\n",
- "@ischargro 3\n",
- "@andykusnetzoff 2\n",
- "@fantinofantino 2\n",
- "@juliamengo 2\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 15,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "racism_df = df[df['racism'] == 1]\n",
- "\n",
- "racism_df['journalist_username'].value_counts().head(20)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 17,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@diegobranca 26\n",
- "@luisnovaresio 19\n",
- "@edufeiok 13\n",
- "@Angelalerena 8\n",
- "@rialjorge 7\n",
- "@robdnavarro 6\n",
- "@Gatosylvestre 5\n",
- "@guadavazquez 4\n",
- "@fantinofantino 4\n",
- "@majulluis 4\n",
- "@JonatanViale 4\n",
- "@cyngarciaradio 4\n",
- "@Cris_noticias 3\n",
- "@ischargro 3\n",
- "@ertenembaum 3\n",
- "@lucianageuna 2\n",
- "@vivicanosaok 2\n",
- "@aleberco 2\n",
- "@NANCYPAZOS 2\n",
- "@nbg__ 2\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 17,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "lgbti_df = df[df['lgbti'] == 1]\n",
- "\n",
- "lgbti_df['journalist_username'].value_counts().head(20)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 18,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@diegobranca 14\n",
- "@JonatanViale 7\n",
- "@edufeiok 6\n",
- "@mjolivan 3\n",
- "@Gatosylvestre 2\n",
- "@Angelalerena 2\n",
- "@majulluis 2\n",
- "@cyngarciaradio 2\n",
- "@robdnavarro 2\n",
- "@NANCYPAZOS 2\n",
- "@rominamanguel 1\n",
- "@guadavazquez 1\n",
- "@hindelita 1\n",
- "@rialjorge 1\n",
- "@fantinofantino 1\n",
- "@luisnovaresio 1\n",
- "@aleberco 1\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 18,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "criminal_df = df[df['criminal'] == 1]\n",
- "\n",
- "criminal_df['journalist_username'].value_counts().head(20)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 19,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@edufeiok 6\n",
- "@diegobranca 5\n",
- "@robdnavarro 4\n",
- "@majulluis 4\n",
- "@rominamanguel 4\n",
- "@JonatanViale 3\n",
- "@guadavazquez 2\n",
- "@rialjorge 2\n",
- "@mjolivan 2\n",
- "@fantinofantino 2\n",
- "@Angelalerena 2\n",
- "@luisnovaresio 2\n",
- "@SANTIAGODELMORO 1\n",
- "@SilvinaMolina 1\n",
- "@NANCYPAZOS 1\n",
- "@aleberco 1\n",
- "@Cris_noticias 1\n",
- "@negropolisok 1\n",
- "@cyngarciaradio 1\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 19,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "calls_df = df[df['calls'] == 1]\n",
- "\n",
- "calls_df['journalist_username'].value_counts().head(20)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 24,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "journalist_username\n",
- "@diegobranca 447\n",
- "@JonatanViale 425\n",
- "@edufeiok 340\n",
- "@Angelalerena 336\n",
- "@Cris_noticias 276\n",
- "@odonnellmaria 256\n",
- "@rialjorge 245\n",
- "@robdnavarro 182\n",
- "@vivicanosaok 154\n",
- "@guadavazquez 151\n",
- "@luisnovaresio 140\n",
- "@majulluis 96\n",
- "@Gatosylvestre 92\n",
- "@NANCYPAZOS 77\n",
- "@cyngarciaradio 71\n",
- "@fantinofantino 70\n",
- "@rominamanguel 64\n",
- "@mjolivan 64\n",
- "@nbg__ 55\n",
- "@lucianageuna 50\n",
- "@ischargro 44\n",
- "@marialauratv 40\n",
- "@juliamengo 34\n",
- "@aleberco 29\n",
- "@anaecorrea 27\n",
- "@ertenembaum 20\n",
- "@VHMok 16\n",
- "@barilirodolfo 14\n",
- "@negropolisok 14\n",
- "@diegoleuco 9\n",
- "@hindelita 8\n",
- "@Sietecase 8\n",
- "@andykusnetzoff 6\n",
- "@alfleuco 6\n",
- "@wwnicolas 4\n",
- "@MercedesFunes 4\n",
- "@SANTIAGODELMORO 4\n",
- "@deboraplager 4\n",
- "@maclorena 4\n",
- "@Marcelitaojeda 3\n",
- "@soyingridbeck 3\n",
- "@SilvinaMolina 1\n",
- "@monigps 1\n",
- "@FlorHalfon 1\n",
- "Name: count, dtype: int64"
- ]
- },
- "execution_count": 24,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "attacks = df.dropna(subset=['label'])\n",
- "\n",
- "attacks['journalist_username'].value_counts()\n",
- "\n",
- "# Tomar en cuenta número de seguidores"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 6,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/plain": [
- "['Todos centros y premeditado, volvé con las notas a las vedetongas',\n",
- " 'Que raro vos sacandole el jugo al puterio. Cuanto t va a durar el amor x el panqueque?',\n",
- " 'Seguro, le chupas las medias',\n",
- " 'Jorge pregúntale porq yo como monotributista clase A, no puedo cobrar el beneficio y la clerichi siendo mono tipo A está en Marbella y compra Rolex?',\n",
- " 'Lo vas a mimar un rato',\n",
- " 'Llevaste las rodilleras?',\n",
- " 'Supongo habrás ejercitado la boca para esta tarde ya que le vas a chupar las medias en todo el reportaje',\n",
- " 'Y a veces te enredas \\nSe hace la mala hasta q haya quien le acomode la mandíbula',\n",
- " 'Cuando habla tu pseudo hija ,te tiembla el culo.',\n",
- " 'Y vos con los cuernos',\n",
- " 'No, vos lucido no sos solo sabe de puterios',\n",
- " 'Chocolate, numerologa, gatitos y barquitos, eso es kirchnerismo',\n",
- " 'Lindo gatito @SergioChouza ehhh?',\n",
- " 'Mere presa entonces a la rolinga de la maira mendoza x tener ctas en Miami.. y a toda tu catarba de kukas políticos chorros y a lo mejor vos también, con alguien que tiene tus cuentas con otro nombre..el que te cree esta mal de la cabeza .',\n",
- " 'Y lógico, si la gente evade impuesto, quien va a pagar las putas y los yates?',\n",
- " 'Pobre va a tener que ir a visitar a @MalenaGalmarini a la carcel de mujeres.',\n",
- " '@fantinofantino Clerici enloquece a los hombres pero no se dan cuenta que es una prostituta.Y Miriam te hizo dormir en la calle.Ahora hunde a Insaurralde.',\n",
- " '¿No estabas engripada?',\n",
- " 'Mírate lo poco que sos. Soberbio. Lleno de violines, culos flojos, dictadores, clonazepam, y psicoticos \\nAnda que te cambie los pañales Massa. \\nFracaso',\n",
- " 'Se llama trabajar en el sector privado, capaz sos munipa y no sabes de esas cosas, bullrich lleva 40 años viviendo de los impuestos boludaso',\n",
- " 'No tomes nada q se te lengua la traba....',\n",
- " 'VIEJA GAGAAAAAAAA',\n",
- " 'No entendés la temática de x. \\nNunca abogado, porque aunque lo fueras, no entendés derecho. \\nMeada la Mondiola Diana, la Hermana tarotista y todo la juntada de analfa',\n",
- " 'Ojo con este peluquitas encubierto pato..',\n",
- " 'Si, boludita... Si creer eso te pone feliz pensa lo que quieras. Ahora anda a cambiarte el pañal meado que tenes',\n",
- " 'Que explique el monopolio de la habilitación de los Matafuegos en Caba que maneja su marido',\n",
- " '@fantinofantino vos la hiciste conocida cuando en tu programa llevaban gatos',\n",
- " 'Ojo con los tragos, que embole esta bruta hablando 2 horas creo que no llega ni a 10 minutos',\n",
- " 'Fanta le vas a regalar un vinito?',\n",
- " 'Zzzzz. Denle la pastilla antes de entrar porque se le lengua la traba y no modula, como en el debate',\n",
- " 'Buen dia chicos!! Buen comienzo de semana!! Participo por el secador de pelo de #lasmargaritas #ElClubDelMoro @la100fm @SANTIAGODELMORO',\n",
- " '#ElClubDelMoro @SANTIAGODELMORO \\n@la100fm \\nParticipo por el secador de #lasmargaritas',\n",
- " 'Que vieja infumable. Si Insaurralde es millonario imagínense a la jefa de la banda. Tiene más guita que Madonna la groncha. #PatoBullrichPresidente2023 #PatoPresidente #PatriciaBullrich',\n",
- " 'La conchu....a',\n",
- " 'esta sra. está igual que la Clérici, solo le importa su culo.',\n",
- " 'Cómo te duele la cola...',\n",
- " 'Si Roman que se vaya !!! Pero dejen de hablar de la Señorita que viajo con el paga Gato , como si fuera una Dama , inocente, es un Gato pago en el hotel del exótico pelado que tiene hotel en Miami también',\n",
- " 'Andate vos gallina de mierda',\n",
- " '@edufeiok estas mejor de la fisura en el ano?',\n",
- " 'Ni sabe conjugar un verbo, primera persona plural: somos. Bruta. Chorra. Peronista tenías que ser. O k. Es lo mismo con diferente olor.',\n",
- " 'Viejas viciosas y sin remordimientos. Ya las van a parrillar el inombrable.',\n",
- " '@edufeiok no puedo creer las conjeturas q haces sobre el gato cascoteado de Insaurralde, es la prostituta de los peronistas ma q novia',\n",
- " '@edufeiok El oficialismo se hace el espantado con Insaurralde, pero piensan. :.que.tipo.pelotudo!! Cómo se dejó.agarrar.! Cosa de vedetongas !',\n",
- " '@edufeiok No se metan con el gato, ella es una laburante el tema es quien la contrata',\n",
- " '@claudiosavoia @edufeiok @EldiariodeLeuco\\nEL HIJO DE PUTA MAS GRANDE ES EL GATO FUGADOR DE 45 MIL MILLONES DE PALOS VERDES Y TODA LA JUSTICIA CORRUPTA COMPRADA POR ÉL\\nEL ARMADOR DEL INTENTO DE ASESINATO A CFK MILLMAN Y.SUS PUTAS. Y TODOS USTEDES ENSOBRADOS DE MIERDA! SE LES ACABA',\n",
- " 'Cómo te duele que le haya ganado a la beoda que ya ni las neuronas le responden\\nAhhhhhclarooooo estaba engripada jajaja ',\n",
- " 'Es una tarada abortera igual que vos. Bobo',\n",
- " 'La feminista que le gusta hacer piquete. PERO ELLA DICE QUE RECLAMA PARA QUE LOS NIÑOS COMAN. AHH CLARO MIS VIEJOS ME ENSEÑARON QUE CUANDO NO HAY PARA COMER HAY QUE SALIR A PEDIR. PERO POR FAVOR NO SEAMOS IGNORANTES.',\n",
- " 'Concuerdo totalmente lástima que parece querer eliminar el género masculino. Se pasa de feminista',\n",
- " 'Volvé al closet que eras mejor periodista y más objetivo que el metro sexual (autopercibido) LGBT y abortista que sos ahora',\n",
- " 'Cerra la cola esa llena de aire que tenes mariposa llorona y zurda',\n",
- " 'Jajaj nosotros tenemos a la leona villaruel, una patriota, pato criollo es una traidora subversiva.... fin del relato',\n",
- " 'Bregman la delincuente vaga',\n",
- " 'Bueno ya sabemos de q lado estás, no te imaginaba al lado d la zurda con OSDE !\\nSacar a Maldonado de la tumba, una ridícula, el temita mujeres me tiene harta, los hombres son desechables, vos por ejemplo, no canta el himno y no se siente Argentina\\nPero presidenta, SI?!\\n#Pato2023',\n",
- " 'Solo piensa en seguir viviendo de la gente llevando a los piquete a los planeros obligados y victimizando a las mujeres!!!',\n",
- " 'Seguí en club haciendo orgias con tu marido salame',\n",
- " 'la pelotuda de la Bregman todavia sueña con tomar el palacio de invierno de los Romanoff...!!!! ya fue , la forrita esta atrasa +100 años...!!!!',\n",
- " 'Estás como looooook con el debate. Tu candidata la peor de todas.',\n",
- " 'SI VA ESCABIADA QUIZA SE LE ENTIENDA',\n",
- " 'Su fuesen japi no te perderías...',\n",
- " 'Insaurralde-gato con O al final. Ah perdón mala mía',\n",
- " 'El gato d insaurralde es el mismo que el d.scioliii ',\n",
- " 'Está como la tuya ,la borracha,afuera jajaja judío estás al horno,si gana el gatito sin pauta,vas a tener que gastar la de papá,otro que vivió del estado siempre',\n",
- " '@MalenaGalmarini Revisa el telefono de Ventajita que era amigo de este come gatos caros de Insaurralde. Te vas a llevar una sorpresa, bue tu viejo come gato, viejo pasado.',\n",
- " 'Tendrian que poner una foto de la tatuada mostrando el orto.',\n",
- " 'Que renuncie a la intendencia \\nQue lo investiguen a el y sus hijos mayores\\nA la Cirio que recibió 20 millones de dólares \\nY al nuevo gato monotributista',\n",
- " 'Con el colchón caliente',\n",
- " 'Con lo falta que te hace falta garchar a vos gordito lechoso...los cuernos aflorando.',\n",
- " 'Con las putas que “lo florean” como no se van a olvidar! Te la tomaste toda sinvergüenza!',\n",
- " 'Jajajaj el dro gon y el paga gato gobernaron 4 años ... pobres ahora todos sumidos en el barro mientras ellos serán millonarios por siempre, entendés la importancia de votar bien?',\n",
- " 'INSAURRALDE GATEROOOOOO PONELA PERO CON LA DE TU BOLSILLO NO CON LA DEL PUEBLO',\n",
- " \"¿Qué t metés con @Kicillofok? es intachable y no tiene la culpa de dónde la mete @minsaurralde . Dsd Perón y las pibas universitarias, pasando por el turco traidor y su harén, siempre están los q' gastan en pu ras vedetongas o travestis, qué querés que haga Axel...? ¿castrarlo?\",\n",
- " 'Se fue al joraca con lo de la facha bárbara… lo de las prostitutas, yates, rolex, regalos lujosos y extracciones millonarias de cuentas de banco todavía se bancaba…',\n",
- " 'Le gustan los gatos nomás, está prohibido?',\n",
- " 'De la manada de gatos que Milman puso como asesoras que pagamos con nuestros impuestos no te escuché ningún comentario, y Gerardo sigue en su cargo y la mayoría de los felinos también.',\n",
- " 'Y todos sabemos q vos sos un chupa pija y?',\n",
- " '@JonatanViale Joni si a este gato le pagaron para deschabar a Insaurralde, debe de haber sido muchisimo para saber q su trabajo de gato se termina, ya no es confiable como todos. Si hay algo q saben es q tienen q hacer silencio',\n",
- " '@JonatanViale Joni, esta mina es una Prostituta fina, busca giles con plata y los seca. Cirio es diferente? Abz',\n",
- " 'Fue la única que mencionó a Insaurralde tu pollo Milei la zurda de Bregmman y el agente de viajes de Córdova no lo mencionaron. Es corrupcion es escándalo y vos solo decís que PB no hablo lo suficiente de eso? Se te nota mucho chirolita, ya sabemos quien es tu ventrílocuo',\n",
- " 'Che hombre rata, ¿A quién mierda de aquí para adelante lo de Insaurralde? La borracha no propuso nada y el degenerado la puso contra las cuerdas con el tema de las Leliqs, se nota que no sabe una mierda de economía.',\n",
- " 'Qué esperabas de una señora que está más cerca del geriátrico que Insaurralde de los gatos. De verdad considerabas a esa mujer como una candidata seria??? Le podés preguntar su plan económico, porque a Milei te faltó preguntarle el tipo de sangre nomás cuando lo entrevistaste.',\n",
- " 'Cómo me gusta el olor de pautero cogido por la mañana.\\n\\nSe te acaba la joda, Mandela.',\n",
- " 'Que pasa que no se acciona con esa corrupta? La cara de estúpida y su mal gusto parecía bobo .flor de chorra',\n",
- " 'Se fue de putas y renunció, ahora habla de mil man.',\n",
- " 'Le va a pedir el disfraz a bulrrich q se puso con lo de millman y sus asesoras gatos, de eso no hablas? Periodista independiente',\n",
- " '@barilirodolfo Che Rolo que te paso en la trucha que la tenes toda podrida??? A vos también te opero Lotocki por canje???',\n",
- " '@barilirodolfo aflojale al botox, sos un muñeco de cera a punto de derretirse!!!\\n\\n#Debate2023 #DebatePresidencial2023',\n",
- " 'Ig de la minita ?',\n",
- " 'casi no la conozco @lulitru con la cara hecha \\nlabio y algo mas creo, linda \\n@EstebanMirol capo, claro y tranquilo, le pasa el trapo a @barilirodolfo mojado y tembleque nervioso',\n",
- " 'Che,los 20 palos verdes no te parecen un programon gato?',\n",
- " 'Ojalá la Cirio se vaya porque no es útil en ninguna parte del programa. No sabe ni de cocina ni de música.',\n",
- " 'Hay que mantener ese gatito ehhhh. Seguro fue tan cómplice como el, hasta en la tele la acomodo.',\n",
- " 'para cuando presaaaaaa!? A un pobre emprendedor que se pasa 10 cm con la medida de un consultorio le clausuran el local y a este gato VIP le dan 22 MILLONES DE DOLARES y va tranquila a laburar?!!!',\n",
- " 'ENSONBRADO, hablá del gato de Insaurralde disfrutando de vacaciones en Marbella con la NUESTRA ',\n",
- " 'Hace rato que el turco habla y no dice, solo engaña al pavote de @gato',\n",
- " 'No pueden ser tan giles la @myriambregman trabaja p ella como todo dirigente #zurdito Con ese 4 o 5% se acomodan en la burbuja dla \"casta\" mientras a sus piqueteros NO LES CONSIGUEN NI TRABAJO \\nFeministas son las mujeres q piden x sus derechos y no x #cargos \\n@C5N @Gatosylvestre',\n",
- " 'Solo te voy a decir que a @myriambregman le doy bomba hasta que se ponga un pañuelo celeste en el cogote...',\n",
- " 'Milman se anota, pero pide que no la llamen \"gato\" sino \"asesora\".',\n",
- " 'Voto el gato sylvestre, navarro, tomi massa y daddy brieva.',\n",
- " 'Para toda la sarta de chupapij4s como vos pudo haber ganado algo el panqueque en versión zen...! Al festejo post debate lo organizó Martincito...? Altos gatos habrá llevado...!',\n",
- " 'Ojalá Robert!! Así gana en primera vuelta, arregla todo el desastre que ud mismo hicieron, y mete presa a la yegua!!!!',\n",
- " 'Ganó tu puta !!',\n",
- " 'No hay japi que les venga bien a ustedes.',\n",
- " 'Ninguno tenía la cola limpia seguro',\n",
- " 'Increíble que usen de la nuestra para mantener gatos!',\n",
- " 'Increíble que se use el presupuesto para pagarse las putas che.',\n",
- " 'Un día te va a explotar la BURBUJA que tenés de cerebro!!! ',\n",
- " '@robdnavarro TROLL K A SUELDO LÁVATE EL ORTO y TOMATE LA SOPA \\nDigas lo que digas YA LA TIENEN ADENTRO y SIN VASELINA ',\n",
- " '@aleberco tenés que poner en la cortina lo del #gatitomimoso de @myriambregman !!',\n",
- " 'Para poder escuchar a @aleberco hay q tragarse los sapos de la @BallesterDani el fanático del gato y la chupamedias de Alberto: Ayerdi...@C5N #Debate2023EnC5N',\n",
- " 'Por tipos como vos nació un Milei, por culpa del feminismo y por la identidad de género ahora nos vamos a tener que fumar a este loquito. Dios nos ayude!!!',\n",
- " 'No rompas las pelotas gorda histérica , si existe otra visión es xq la gente no es imbécil como uds',\n",
- " 'como se nota que tenes la barriga llena vos... los argentinos están preocupados por temas mas importantes como comer.',\n",
- " 'Chúpale el culo Branca',\n",
- " 'Y el fullero? Así nos va, miseria, pobreza, inflación imparable, y quiere ser presidente panqueque!',\n",
- " 'Pero ustedes saben de gatos.',\n",
- " 'Lleno de botox y cama solar....o estuvo en republica Dominicana?????????',\n",
- " 'el botox no le dejaba cerrar el ojo, como a vos no te permite abrir la mente',\n",
- " 'derrotada está tu cola, mamaza',\n",
- " 'Insaurraldea repugnante k homenajea gatos..\\nMiau gordi to',\n",
- " 'A vos te gustan los violines culo roto',\n",
- " 'Cerra el cul0, mequetrefe!',\n",
- " 'Lo que se te traba a vos son las guampas caracol',\n",
- " 'Si. Obvio que a vos te va a interesar, pedazo de Judas!',\n",
- " 'Jajaja anda manita menos mal le queda poco',\n",
- " 'Jaaa q te la den a vos así seguiste viajando. C tu amiguito con alguna hembra',\n",
- " 'Pero si al trabajo ya se perdió cara de pija',\n",
- " '“Sos un Gatito mimoso del poder económico”\\n\\nAplausos para @myriambregman',\n",
- " 'Acá el gatito vip con el kirchnerista amigo del gordo frulalá',\n",
- " 'Hablando de gatitos, no te hizo ruido con los de ustedes? Que aparte son carísimos',\n",
- " '@diegobranca no escuché que dijeras nada del delincuente kirchnerista que puso Mínimo en la jefatura de Limitado y que la yegua condenada por corrupta lo queria de candidato a presidente. Sos tan hijod1000pu a como ellos',\n",
- " 'Se estuvo cuidando toda la semana......Síndrome de abstinencia. Tendria q haber ido copeteada....para agarrar valor',\n",
- " 'Le falto la previa, se mando al boliche de una',\n",
- " 'Se traba pero haciendo y laborando les pasa el trapo a todos. Se sabe',\n",
- " 'Trabajás en c5n?\\n\\nLas putitas de insaurralde te agradecen.',\n",
- " 'Pareciera que le están dictando por cucaracha si la hacen peinar para atrás creo q se le ve el auricular jajajaja.\\nEl único que está diciendo cosas coherentes y se le nota que tiene xperiencia en gobernar algo es schiaretti. Además conoce el interior',\n",
- " 'El botox que se hizo no la deja vocalizar .No se entiende nada ',\n",
- " 'Se le lengua la traba.',\n",
- " 'Píldoras.',\n",
- " 'Siniestro son ustedes caradura, ni hablar la veces q amenazaste tus ex parejas, cuando agrediste verbal y físicamente tus ex parejas etc etc y ahora sos pañuelo verde caradura',\n",
- " 'Siempre igual el gato haragán...que asco',\n",
- " 'Chupadte una pija huevo duro. Ocúpate del cerdo q va hacer visitas higienicas',\n",
- " 'Cómo te supera el resentimiento, nunca serás presidente de Boca ni Presidente de la Nación, nunca tendrás una primera dama como la gente no un gato!!!!',\n",
- " 'Vos sos mas sorete que esa mujer huevoduro. Sabelo',\n",
- " 'Que asco me das huevo seco dios te castigó y nunca vas a tener hijos legitimos',\n",
- " 'yo creo q soy una loca trastornada porq hablo con mi viejo q esta muerto y a mi perra q ame.. vos no sos capaz de hablar con tus hijas q son dos desastres',\n",
- " 'Ya muchos se dieron cuenta de la pelotudez de tocer cuando le tocaba hablar',\n",
- " 'Ojalá el domingo te demos en la pera por cucaracha',\n",
- " 'A da a la renegrida concha de tu hermana.. sorete..!!',\n",
- " 'ni una prostituta esta tan interesada por dinero....',\n",
- " 'Lo que es ser misogino producto de tu incapacidad de embarazar a una mujer.',\n",
- " 'Ya te \"volviste\" tan comprensivo con la mujer despues de hacerlas mierda durante año, no decis nada de lo que paso con una mujer que le pasaron los huevos por la cara? O no te queda ser tan feminista?',\n",
- " 'BASURAS, MILEI NI SE MOSQUEÓ, SIGAN TOSIENDO LECHE DE MASSA',\n",
- " '@fantinofantino andá buscándole trabajo en alguno de tus programas a tu pollo...',\n",
- " 'El Virolo y Porota son bebés de pecho al lado del Fullero y la reina de la canilla',\n",
- " '@RomiUhrig la mas hermosa con ese vestido tan sexy y las mejores piernas ',\n",
- " 'El 19 te metes en la sábanas de Miley y Fátima te vas a comer',\n",
- " 'Dibijadadisima',\n",
- " 'Ojo con la rubia, si ve una foto de Massa se deprime y se pega un palo',\n",
- " 'Jajaja, que meada se comió el gatito mimoso. vergüenza ajena',\n",
- " 'Que baile le pegaste a gagaresio',\n",
- " 'Los comunistas se amparan entre ellos , este musico ya estuvo con las del pañuelo blanco y con otra gente de dudosa reputacion.',\n",
- " 'Alojo? Agarrá un diccionario burra',\n",
- " 'UN TROLL OPINA',\n",
- " 'Esta gallega meada y descuajeringada, es otra delincuente acusada de plagio\\nLN+ rascando el fondo del pozo ciego',\n",
- " 'Nooo vos parece que preferís matar mujeres y tirarsela a los chanchos..como en Chaco',\n",
- " 'Vos ni un kiosko podés atender, tengo voz propia no dependo de nadie..lorito barranquero',\n",
- " 'Lacha es un chantun y tiene toda la campera adentro',\n",
- " 'esta gallega pelotuda, seguro que cobra por decrle a los pelotudos que la miran, las pelotudeces que quieren escuchar...\\nMASSA, lo paseo en chota, al desquiciado...',\n",
- " 'Faltó el gato, ustedes dos ensobrads y que gritaran ganamos abrazando la bandera inglesa @edufeiok @PRossiOficial que manga de mal paridos',\n",
- " 'Cómo se nota que nunca viste una conch@ en tu vida virgintario repelente de vaginas',\n",
- " 'En tu cara @BallesterDani',\n",
- " 'Mate con ver ga en el orto te vas a llamar a partir del lunes ...',\n",
- " 'En pija',\n",
- " 'Le arde la cola al mariquita',\n",
- " 'Que domada! @edufeiok ',\n",
- " 'El cuco y el hombre de la bolsa no existen. MILEI 2023 mi presidente',\n",
- " 'Anda a lptqu parió novarecio y tu travesti colectivo trans',\n",
- " 'Sos una mariposa resentida es un animal de la selva tambie , pero su opinion varia dependiendo de su pobre juicio moral.',\n",
- " '@luisnovaresio uds 3 vayan buscando laburo viene la compañera ESMERALDA Y CHAU a laburar d verdad',\n",
- " 'Ayúdame a conseguir esos $20.000 para la cirugía de rubia alias: Mariana.Ibanez.Este',\n",
- " '@luisnovaresio el putarraco..dice no m meto en ese tema..HIPÓCRITA SOS CÓMPLICE..',\n",
- " 'Da asco esa resentida',\n",
- " 'Que asco el sucio degenerado de @luisnovaresio en la pantalla de @LANACION',\n",
- " 'Se te van a paspar los labios de tanto besarle el ogt',\n",
- " 'Agarra servilleta para limpiarte la leche que te quede en la boca joni',\n",
- " 'El gatito mimoso jaaaa no vayas a toser, jonyyyy',\n",
- " 'Que chupada de pija le estás pegando',\n",
- " 'Que de plata estas haciendo jony. Si te viera tu viejo por favor. SOS un sicario',\n",
- " 'Al final no lo maneja el.perro delas allá ...lo maneja el gato del más acá \\n..tu jefe Macri Viale ensobrado\\nMilei es casta',\n",
- " 'Llévate una toalla para limpiarte la leche',\n",
- " 'Se la vas a mamar? Sí o No?',\n",
- " 'Llevate unas servilletas para limpiarte lo que te quede en la carita',\n",
- " 'Charlamos? O chuparas medias?',\n",
- " 'Charlando??, a mi me parece que se la estas mamando !!',\n",
- " 'Tan chupa pija sos?',\n",
- " 'Lavate los dientes después, cochinote',\n",
- " 'Le vas a chupar mucho las medias ??',\n",
- " 'Se la va a mamar en vivo?',\n",
- " 'Más que mano a mano, vos le vas a estar chupando la pija. \\nAsco das.',\n",
- " 'Con calzones de lata está vez !!???? Cómo le quedó el clt o anoche',\n",
- " 'Se viene mamada en vivo, gordo tragaleche???',\n",
- " 'llévate una servilleta para limpiarte la boca, chupa pij4.',\n",
- " 'Flor de chupada de pija le vas a dar, no? SOS un loco lechita...',\n",
- " 'Otra chupadita de pija? Le dijiste que se bañe por lo menos? \\nTu viejo se está revolcando en la tumba, no puede creer lo panqueque y vende patria que le salió el pibe',\n",
- " 'lleva pañuelitos descartables man... ',\n",
- " 'Ya preparadas las rodilleras y las pastillas Halls de menta???',\n",
- " 'El gatito mimoso de la casta con el gordito lechoso ',\n",
- " 'Le vas a tirar la goma como a M*cri?',\n",
- " 'Reparti antitusivos en el set, no vaya a ser cosa que se sienta incomodo el gatito....',\n",
- " 'Te vas a tomar toda la chechona, chinwenwencha! ',\n",
- " 'Limpiate el bigote de leche',\n",
- " 'Jonnyy no le levantas la imagen ni inyectandole viagra en sangre al javo',\n",
- " 'LLEVA LAS RODILLERAS, LAS MISMAS QUE USAS CON TU PATRÓN. \\nG.L.',\n",
- " 'A la sin hueso como siempre...\\nAl hueso*\\nMala mia',\n",
- " 'No perdés oportunidad de reafirmar que te gusta chuparla y que te dejen la leche chorreando en la cara.',\n",
- " 'Ufff la de lamida de glande que va a haber ahí!',\n",
- " 'Te hiciste la tira de cola ya?',\n",
- " 'No te olvides las rodilleras y el babero así no te lastimás ni te manchás la camisa con semen de \"la vaca mala\".',\n",
- " 'se viene la mamada del siglo. no tosas por las dudas...',\n",
- " 'Hoy la vas a tragar también?',\n",
- " 'llevate el babero',\n",
- " 'Prepara las rodilleras!!',\n",
- " 'Pedile que se ponga medias nuevas y prepara tu lengua para una buena chupada, y no te olvides de preguntar a tu patrón Mauri que podes decir y que no.',\n",
- " 'Haciendo el laburito fino\\nPrepara la garganta para tomar la chechona',\n",
- " 'Uhh se viene la una succionada de pn asquerosa @c0o0ni',\n",
- " 'Pero paren de chuparle la Japi, déjenle algo a la hermana!!',\n",
- " 'otra vez vas a chuparle la pija a milei joni? ah pero flor de putita de macri sos eh',\n",
- " 'Cortate las comisuras de los labios que dicen que es una anaconda',\n",
- " 'ya te pusiste las rodilleras?',\n",
- " 'Ya preparaste la cola ?',\n",
- " 'No te olvides las rodilleras. Te va a quedar la mandíbula atrofiada de tanto chuparle la pija.',\n",
- " 'Le vas a dar otra chupada de Japi?',\n",
- " 'seguramente será una gran felanota',\n",
- " 'Te la vas a tomar toda chjinguenguencha',\n",
- " 'Que lindo verte en vivo y en directo tirando la goma gordita',\n",
- " 'No vas a toser hombre leche….',\n",
- " 'Ponete el babero por si se te chorrea la leche',\n",
- " 'Lactiboy hoy tenés q ganar horas extra',\n",
- " 'Derrama la leche gatuna',\n",
- " 'Hoy se la maman con las dos manos?',\n",
- " 'Ufff vas a hacer un pete fantástico dogor, ya veo, el mejor porno! \\nescondan a Marra q se va a romper una mano.',\n",
- " 'Paaaa la atragantada q te vas a pegar con las medias del javi',\n",
- " 'preparando las rodilleras',\n",
- " 'Llévate servilletas para limpiarte la leche de la cara joni',\n",
- " 'No te olvides las rodilleras',\n",
- " 'Rodilleras Jonatan, después estas con todas las rodillas peladas.',\n",
- " 'No te olvides las rodilleras',\n",
- " 'Sos el perrito que se llama mentís,mentis,mentís.. están desesperados y salen con cualquiera jijij',\n",
- " 'Deja de ladrar y anda a laburar para pagarle el tto',\n",
- " 'Chupa el palito de helado León ',\n",
- " 'Che, no te quedan problemas en la mandíbula? Mucha pija estás chupando.',\n",
- " 'Como te duele la cola...',\n",
- " 'Actualiza el CV, rata',\n",
- " 'Preguntale porque comparo un partido de fútbol con la guerra de malvinas. \\n\\nNo le hagas caricias al gatito mimoso. Ejerce 1 puta vez en tu vida.',\n",
- " '2 petardos en una semana, ya sos más que fatima y karina',\n",
- " 'Se te ve la tanga, cara de pija.',\n",
- " 'Capaz tenes mas suerte metiéndote el dedo en el ogt',\n",
- " 'Ya que sacaste el dedito, metetelo en el upite.',\n",
- " 'Me parece que sacaste la cola por la ventana, te pusieron un dedo',\n",
- " 'Ya tiene novio nuevo, nunca un verdulero..',\n",
- " 'Realmente al gatito mimoso,se le agotó el ronroneo, me parece que en el debate le hubiera quedado bien la Grace de Bernardo Neustadt ,(no me dejen solo) este tipo es un cachivache!!!!!',\n",
- " 'Como cambiaste nacho desde que trabajas con el gato.',\n",
- " 'Hola gato bueno ahora hay que hamar',\n",
- " 'No va porque tiene la Co laa sucia',\n",
- " '@Gatosylvestre \\n@BallesterDani \\n\\nOJO MILEI VA USAR AURICULAR TAPADO POR EL PELO PARA QUE LE DICTEN!!',\n",
- " 'Acá estamos firmes a C5N como siempre la realidad mas que nunca en este domingo otro día especial para el país en el último debate presidencial de cara al balotaje ecxelente cobertura de C5N los mejores siempre que bueno verte gato sos un grande lejos y acompañado de la dama dani',\n",
- " 'Los dos gatos.',\n",
- " 'Vos no ahorras en dólares gato?',\n",
- " 'Deja de tragar leche',\n",
- " 'Y vos ??? Qué sos??? Representás a la buena gente??? A los que asustan??? A los que empobrecen??? Andá palla BOBOOOOOOOOOOOOOOOOOOOO',\n",
- " 'y le siguen dando a la maquinita: TN, LN+, los trolles liberfachos\\nreviviendo (digamos...) el debate tratando de opacar la paliza del MassaPalooza de anoche',\n",
- " 'Patotera y ahora te echas atrás?',\n",
- " 'Porque te gastas Rey en responderle a un taguerna que no se sabe limpiar el OGT..',\n",
- " 'Jajaja ni idea la mina',\n",
- " 'Es como hablar de hombre panqueque,chorro, mujer y familia monto ,no digo desde hace más de 35 años',\n",
- " 'De eso solo se ocupa el gato, te da cátedras d espionaje y auto secuestros',\n",
- " 'Las ojeras en esa carita son de exceso de la alternativa Marrista a la ESI',\n",
- " '@RAMIROMARRA\\nUn consejo. Largá la paja, te está haciendo muy mal, te está quemando las neuronas.',\n",
- " 'Rencoroso el gatito mimoso',\n",
- " 'Jaja\\nAsique no le vas a hacer una rabona a Yepes!??',\n",
- " 'Que hdp...ni el gatito mimoso se atrevería a tanto...',\n",
- " 'No se tiene que vestir.. así se la mamas por los sobres...',\n",
- " 'Tu mujer está desnuda salamin',\n",
- " 'Escupila que te vas a atragantar...',\n",
- " 'Ahora no es gratuita ni de calidad lechón impotente',\n",
- " 'Vos recibís más sopapos todos los días traficante de grasas trans, y seguís por acá. Más chupa pija que vos no se consigue sorete',\n",
- " 'Sopapo te daría yo !!! Pedazo de mierda!!! Un solo cachetazo y te acomodo la única neurona que habita ese cráneo vacio',\n",
- " 'Existe posibilidad que la dogor de tu jermu tire la goma',\n",
- " 'te tiramos una toallita femenina a vos?',\n",
- " 'En unico ignorante sos vos, seguro que si te cruzo por la calle salis corriendo, ni siquiera sos guapo para resolver las cosas como hombres...',\n",
- " 'Un pañal por acá, por favor',\n",
- " 'Chupa culo de un chupaculo ,que desagradable .\\nO sea chupaculo de 2da. Bua',\n",
- " 'la puta del gobierno salió a hablar',\n",
- " 'Vos das vergüenza, arrastrándote por una pauta y un plan, traga leche hijodeputa',\n",
- " 'Dieguito estás diciendo huevo con la boca cerrada. Vas a necesitar crema hemorroidal.',\n",
- " 'Estab militando a masita igual q militaron a alberso ustedes, jajajaj sapo tras sapo se meten x el culo y la vieja condenada cagandoseles de risa con su vida d millonaria…eso si condenadas hsta el ultimo d sus dias',\n",
- " 'Jajajjaaajja anda a votar vos a peluca loca bigotón boludo ',\n",
- " 'Por desgracia para vos, la virginidad no la puedo recuperar.\\nPero vos tampoco te podés recuperar de ser un traba violador de menores.',\n",
- " 'SOS un desastre de persona, lo mismo perfíl que por una pauta se vende como puta',\n",
- " 'Te felicito por la poronga que te comiste esa cara fue inolvidable, ahora ándate a laburar a mexico y ojalá te vaya bien así no volves mas',\n",
- " 'Como te duele la colaaaaa',\n",
- " 'Que paso intento de mafia,que paso con MILIE, anda a ayudar a la falopa de la gorda chancha de hija que tenés ,explícale como la conseguiste así deja de ser tan asquerosa tu hijita HDP',\n",
- " 'Como esta tu orto? Arde mucho?',\n",
- " 'BAJATE RIAL HACELE CASO A VENTURA A LA NIÑA TROLI BAJATE andate a España lpmqtp',\n",
- " 'Hermoso ver las caras de tuje… ',\n",
- " 'Queríamos verles las cara de orto! Empezando x vos!!!',\n",
- " 'La tenés todita adentro!',\n",
- " 'NO NOS OLVIDAMOS LO Q LE HICISTE A BEATRIZ SALOMON HIJO DE PUTA !!!! VOS Y LAS GORDAS PUTAS DE TUS HIJAS VACAS LECHERAS',\n",
- " 'Aprovecha que va a haber venta de órganos y búscate un par de huevos, hijo de mil putas',\n",
- " 'Trabquila esta tu cola jjaja, o estas mal porque perdes los sobres. Ni tu hijas te quieren',\n",
- " 'Habia un sapito hablador..que le paso? Se lo comió el León?! el chiste se cuenta solo ',\n",
- " 'Andá a laburar Manu',\n",
- " 'Las nenas no tienen cerebro !\\nDe tal palo tal astilla.',\n",
- " 'Parásitas inservibles',\n",
- " 'Me corto las venas ,que minas boludas y vagas',\n",
- " 'Mira las hijas \"D\" el pedo filo, maltratador, violento, maleducado, el q trato de CHORRAS a sus hijas y su ex, el q dijo q si tenía enfrente al hijo italiano lo escupía, al q murió solo como perro, al q eligió la droga y la joda ants q a sus hijos !D verdad c cuelgan dl muerto',\n",
- " 'Me das tanto asco, tenés lo que te mereces',\n",
- " 'Te chorrea lo gato pago que sos rial',\n",
- " 'Maltratar a las mujeres',\n",
- " 'Dale dale Jorgito Seguí pegando que necesitas sobres más abultados. No descanses!!! Dale nomas. Total dsp vos te vas a trabajar afuera,te gastas la q vas a ganar con el gato de turno,y a nosotros nos dejas con los corruptos y narcos gobernandonos.',\n",
- " 'A vos se te ocurre denigrar a las mujeres. Dejarlas sin trabajo. Y demas.cosas',\n",
- " 'Cerra el orto violin',\n",
- " 'Aprovecha la venta de órganos a ver si podes vender los huevos!!!\\n\"MAYONESA DE VERDURAS\" (no tiene huevos)',\n",
- " 'VOS TENES LA \"RABA\" PELUDA LLENA DE LECHE.... CONCHUDA..... Y BLOQUEAME FORRA SI NO SOS NADIE... NADA MAS PARA QUE TE PUTEE',\n",
- " 'Chorreas veneno..estás a favor de ka muerte.. sos una pobre mina resentida',\n",
- " 'Vamos morena!!! Andá con el pai de nuevo!!!!',\n",
- " 'Se lo dijo ...ahora inflable del gato',\n",
- " 'Que sabes el país que se viene idio ta, enséñale a trabajar a tu hija',\n",
- " 'Basura este maltratador de mujeres este sangano es complice de corruptos devolve todos los sobres basura...y marche preso hipocrita hay un Dios y la tenes q pagar machirulo',\n",
- " 'Qué mina asquerosa!!! Poca empatia. Lo que no sabe es que ella también se va a joder.',\n",
- " 'Pobre huevo seco .Se la comió doblada y con un nudo en la punta !!!',\n",
- " 'chupa japi',\n",
- " '@rialjorge ¿es necesario que hoy nos tengamos que fumar al gato jovato sin tetas ni cerebro hablando del peronismo? APAGUÉ.',\n",
- " 'Es el país de chupa pijas que vos también vas a aceptar,chupa berga.',\n",
- " 'Dale bobalicona , en unos meses te veremos cómo estás, hoy por lo menos le entrabas a la Presto Pronta, anda cuidando el césped por las dudas.',\n",
- " 'Cerra el orto y anda a revisar la polenta',\n",
- " 'Ya ganaste plata con el javo?',\n",
- " 'La querés chupar un rato?',\n",
- " 'Que desagradable debe ser chupar un culo todo roto.',\n",
- " 'A la pelotita otro corredor de maraton en culo!!',\n",
- " 'Q le perforen el orto',\n",
- " 'que cogida que te pegaron hace baño de asientos.',\n",
- " 'Flaco 40% de pobres, agradezcan ustedes hijos de re mil putas que no los estamos ahorcando con alambre de fardo en el obelisco FORRO HACETE CARGO UNA PUTA VEZ DE ALGO NEGRO PUTO',\n",
- " 'Javi anda poniendote un Parripollo.',\n",
- " 'Acá lo tenés al pollo de @fantinofantino una joyita @m_cuneolibarona',\n",
- " 'Basta de tortas y putos con problemas en los orificios, ponete un kiosco o un uber',\n",
- " 'Lali la mogolica así era la canción?',\n",
- " 'Sos tremendo hdp miserable das mucho Ascó el sobre tiene que ser grande para chupar tanta pija',\n",
- " 'No largá el sillón y el negocio ni loco!',\n",
- " 'Renunció al whisky',\n",
- " 'Crees que va a largar la torta??????',\n",
- " 'Tu mujer,como chupa la pija',\n",
- " 'Y vos por fachito no te vas a pedir licencia nunca? Nos harías un gran favor',\n",
- " 'Se van de a uno las rartitas porque saben que si se quedan para el 10/12 van directos en cana.',\n",
- " 'Hace falta que te toque los huevos??',\n",
- " 'las órdenes no se la daba el perro muerto sino el gato vivo y psicópata',\n",
- " 'Asco das vos, chupa japi!',\n",
- " 'Igual son para limpiarse las partes,o levantar la caca del perro',\n",
- " 'Seguro son las feministas, les encanta orinar en lugares públicos.',\n",
- " 'Eduardo, Hay otras con excrementos!!',\n",
- " 'Vos sas asco todos los días areastrandote por unos mangos',\n",
- " 'Igualmente sirve!! Sos desagradable',\n",
- " 'Hoy te la comes doblada...',\n",
- " 'Ursula si tuvieras un cerebro proporcional a tu panocha no escribirías semejantes boludeces, no se quien sos, ?? Otra Jessica o clerisi… \\nHueca y calienta verga',\n",
- " 'Por ahí ya se las ligó',\n",
- " 'Buenas noticias, se esterilizo y ya no se reproducirá',\n",
- " 'Quizás ya se ligó',\n",
- " 'Quizá se las ligo ',\n",
- " 'No resiste historia está trola!',\n",
- " 'Y bueno, se tendrá que ligar las trompas.',\n",
- " 'Ya se las ligó?',\n",
- " '¿Te das cuenta Edu que implícitamente estás reconociendo que el gatito mimoso es un anormal, no?',\n",
- " 'Quizá ya se las ató. Qué te metes con las trompas de Falopio de los demás Edu, sos un antiflash. Nadie habla de tu vasectomía, hermano.',\n",
- " 'Capaz se ligó las trompas, no sabés.',\n",
- " 'Se habrá ligado las trompas y se sentirá liberada de votarlo. Calculo que con la nariz tapada',\n",
- " 'tenes una primicia ahi, se ligo las trompas!!!!',\n",
- " 'Se fue domadisima jajajajja',\n",
- " 'Vale destacar que es de las tantas que se hizo famosa por mostrar el orto',\n",
- " 'Sale ligadura de trompaaaaassss, anda a Lotocki!!!',\n",
- " 'y como ya se ligó las trompas, ya no le importa ahora!',\n",
- " 'Ya te cortastes las trompas !! Anda sacando el turno!!! VLLC!',\n",
- " 'y q sabes gil capaz se ligó las trompas',\n",
- " 'Lo positivo de Úrsula es que sin trompas no se va a poder reproducir',\n",
- " 'Dale mongo, mandas al frente a mujeres porque sos vagon vos. Forro',\n",
- " 'Quizás se las ligó ya?',\n",
- " 'es que ya se las ligo',\n",
- " 'Capaz ya se ligo las trompas',\n",
- " 'A Úrsula no la deja pensar con claridad la merka que se mete',\n",
- " 'Hola @ursuvargues, querida, espero que hayas cumplido y te hayas ligado las trompas, no necesitamos mas panqueques en este pais',\n",
- " 'mejor que se ligue las yemas de los dedos, así no escribe pelotudeces',\n",
- " 'Pero se las ligó??',\n",
- " 'Siempre contra las mujeres sionista medio polvo!! Cuando vas a salir del closet?',\n",
- " '@ursuvargues ligate una',\n",
- " 'Bueno que bien tal vez se las ligó. Bien por ella!',\n",
- " 'Pero se las ligó. Tenés que chequear antes de hablar.',\n",
- " 'Supongo que se ligó las trompas o ya le llegó la menopausia.',\n",
- " 'So te las atas mejor ,no sea que salga otro espécimen como vos',\n",
- " 'Quizás ya se las ligó las trompas, como periodista sos un excelente tenista, imagínate',\n",
- " 'Por ahí ya se las ligó. Cual hay?',\n",
- " 'Quizás ya se ligó las trompas, andá a saber!!',\n",
- " 'Ya debe tener las trompas ligadas',\n",
- " 'Si se las liga como va a hacer para agarrar el plan ??',\n",
- " 'Vos, Feinmann, sos capaz de lamerle el culo a quien te ordene el gato hediondo.',\n",
- " 'Las trolas son así',\n",
- " 'Se las ligo y fue a votar, simple',\n",
- " 'Como te quemas las neuronas las pepas',\n",
- " 'Maria dicen q ella se tropezó, ya salieron a hablar x eso ? Espero q puedan salir d esta juntas y q la mina q le pego pague',\n",
- " 'No sabes que hacer con tu vida después quedar como \\nmujer despechada sin una pizca de moral. Pretendes dar consejos sobre a quien votar.\\n',\n",
- " 'Gracias Maribel sos una guerrera !!!! VLLC!!!!!!',\n",
- " 'Qué mujer!',\n",
- " 'EN C5PENE LA CARITA DEL LAMEBOLAS MÁS GRANDE QUE TIENE ESE CANAL DE MASSA, EL GATO SYLVESTRE, UNA CARA DE \"AHORA DÓNDE VOY A LABURAR?\" LUEGO DE TANTAS EFERVESCENTES LABORES DE DEFENESTRAR A MILEI QUE YA NO SABE COMO DISIMULARLO...',\n",
- " '@edufeiok desagradable vos y el gallina váyanse a la mismísima mierda',\n",
- " '@edufeiok @javierlanari @JonatanViale\\n En Roma y patinándose la tuya, Fabiola Fernández se lanza como artista plástica y presenta su primera obra titulada \"Me olvidé de ponerme el tampón\" ',\n",
- " 'Como te duele la cola',\n",
- " 'Cambia la cara de orto boludaso te querés matarrr',\n",
- " 'Luis deja de mamar que se te va a gastar la mandíbula',\n",
- " 'si no te gusta la concha a vos',\n",
- " 'Y vos le crees al acosador de pronosticadores del clima',\n",
- " '@luisnovaresio \\nQue cara de culo tenés ...',\n",
- " '@luisnovaresio tenes vaselina?',\n",
- " 'Seguro los peones como vos , tienen que quedar',\n",
- " 'Apátrida.',\n",
- " 'Limpiate la leche de la comisura, chupaverga.',\n",
- " 'Traga leche',\n",
- " 'Traga leche',\n",
- " 'Vos contento porque vas a seguir tragando lechona de gato',\n",
- " 'Si se van, pero vos te viniste y con la boquita llena de chele gordito mercenario.',\n",
- " 'Callate quesudo anda a limpiarte bien la chota nos vamos para volver mas fuertes',\n",
- " 'Listoooo ya te puedes sacar las rodilleras Milky AntiPatria',\n",
- " 'Pepona contenta porque te sacaste la máscara',\n",
- " 'Perdón Gilla vómito, lo escribí rápido y no lo leí para publicar. Da igual es y sos un VÓMITO. @JonatanViale \\n¿Ahí te gustó?',\n",
- " 'Chupate una pija yoli',\n",
- " 'Che hagobahia. Seguí votando gente con olor a repasador húmedo. Anda pa ya',\n",
- " 'Ay, @JonatanViale! Sacate a esa víbora ponzoñosa de al lado! Es MUY forra!',\n",
- " 'Cortala Canossa !!!! para que la tenes ahi @JonatanViale no suma resta , una resentida',\n",
- " 'Acá hay otra mujer pro vida ',\n",
- " 'Por primera vez le doy la razón a Rial.. Les rompimos el orto..\\n\\nHacete ver, ridícula!',\n",
- " 'Mmmm...las vas a seguir chupando !!',\n",
- " 'Acomodate porque no quiero verte llorar cuando no llegues a fin de mes...gatoo',\n",
- " 'Pija nueva para chupar enano chu3co y resentido',\n",
- " 'Definido que sos un culoroto',\n",
- " '@diegoleuco no te da cosas trabajar al lado de la Cirio',\n",
- " '@diegoleuco no puede ser que la Cirio siga en La peña del morfi !!!! Su novio de moral dudosa ...otra vez !!!',\n",
- " 'Jesica Cirio revolenado el pasaporte xq perdio el Dni en tv despues de estar imvestigada x chorra, mentir y q el ex se fue a Europa con una trola con la nuestra, no se si es xq es tonta y cinica #lapeñademorfi @diegoleuco esperaba mas de vos',\n",
- " 'Sinverguenza, te cagas en los argentinos, te enriquesiste con plata de otros, mugrienta, sos alto gato y mereces la peor de las cancelaciones.',\n",
- " 'Lo que vas a tener que remarla sin sobres gato come pibes',\n",
- " 'Así será gato, así será.',\n",
- " '2 gatos locos y te faltó los aplausos .',\n",
- " 'Bien la vedettonga, mira si la esposa , por ej, ee Dela rua hubiera ido vestida así, manita las novatas de los palcos la hubieran hecho mierda',\n",
- " 'Ig de la minita',\n",
- " 'No fue así y vos sos un forrito pija corta.',\n",
- " 'Te esta llorando el culo, no? Jajaj',\n",
- " 'El no es la dictadura. Vos sos una prostituta de traje, el apodo lo tenes bien puesto',\n",
- " 'Déjate de joder periosobee asqueroso...3 viejas mugrientas meadas eran las gritonas.',\n",
- " 'Si, ese cantico es de un par de gatos locos, pero al final recibió la ovación de la gente. ',\n",
- " 'Que grasa esa mujer hacen buena pareja',\n",
- " 'Mononeuronal alimentada a IMPUESTOS que NOS FALTAN en SALUD SEGURIDAD y EDUCACIÓN, cuando el ENSOBRADO HdP @Gatosylvestre dijo que los excombatientes de Malvinas habían perdido la guerra por COBARDES, no dijiste nada!!! O sos muy SORETE o los sobres q recibis son muy grandes!!!',\n",
- " 'Arresten a la pepona Iñaki Gutiérrez es el que está atrás de todos los ataques . La rubia está llena de odio',\n",
- " 'Cocinando polenta con gato silvestre.... a su termino maria la del barrio',\n",
- " 'Chauuuu vaca!!!! Ahora vas a salir a patear la calle y vas a adelgazar',\n",
- " 'Cómo te sangra el culo gato cobarde no les resulta más la campaña del miedo',\n",
- " 'Jajajajajaja verte llorar gato es un bonus track de las elecciones jajajajaja',\n",
- " '@Gatosylvestre tranqui...afloja....Rubinska esta acostumbrada a lexico de footbol..nervios...incertidumbre..lo que falta que el loco gane',\n",
- " '@BallesterDani @Gatosylvestre van a tener que empezar a laburar chiques...!!!',\n",
- " 'El gato está nervioshoooo y Toto trata de tranquilizarlo y Lulu también',\n",
- " '@robdnavarro @eldestapeweb @C5N @Gatosylvestre @pabloduggan Gordo cara de chancha preñada...se te/les acaba el curro de la pauta y la plata fácil, violadores linguísticos, mercenarios del mal, hijos de puta de polvo mal echado...',\n",
- " 'Que el señor empiece por tu marido!!!',\n",
- " 'Roberto hacete ortear cuerno seco',\n",
- " 'Sta bueno el montaje de audio , estuve ahí y solo eran como máximo 10 viejas resentidas. Mentile a tu señora que no ella te cree.',\n",
- " '3 munipas fascitas de la 3era edad igual que vos @robdnavarro',\n",
- " 'Eran 4 gatos.... mira de nuevo todos los videos falopero ensobrado q duce llamarse periodista',\n",
- " 'Se ve que vos el colón lo conoces por fuera, infórmate bien, impresentable.',\n",
- " 'La tenés adentro culo roto. Fue ovacionado',\n",
- " 'Como te quedó la cola???',\n",
- " 'Despertó, es verdad. Ponete crema y a buscar laburo. TN no te vuelve a tomar ',\n",
- " 'Quisiera estar viendo la cara de orto que tenes jajajajaj',\n",
- " 'Tampoco exageres succionador profecional de subsidios, solo eran 10 viejas meadas y un trompetista que al final fueron opacados por los que aplaudieron de pie a Milei.',\n",
- " 'Jajaja 3 gatos lokosss. Sigan con su show. El 19 se vota un cambio. Basta de ñoquis k',\n",
- " 'Se te acaba el curro Putito',\n",
- " 'Espero que hayas dilatado bien ese culo porque la verga te está entrando con fuerza y no hay vaselina',\n",
- " 'Dalee con un patrimonio de 300 mil pesos y no le econtraron pruebas? A Jesica Cirio que pidio pensión por separarse 50 millones de dólares. VAMOSS la gente no es boluda y si cayo el gato ese por que uno tenian que matar y eligieron al político',\n",
- " 'Navorro pobre idiota te qedaste sin sobre y estás looooKaaaa ...noooo ???',\n",
- " 'quien es la gorda torta que es obvio que el tio la violo ?',\n",
- " 'Si tan desagradable te resulta para que lo miras? O trabajas de trol?',\n",
- " 'Cristina Pérez está vetada?? Si el novio ya perdió.. saquenla del freezer cagones',\n",
- " 'Cómo te duele la cola ,el leoncito te la puso .',\n",
- " 'CompuTrabajo\\nBumeran \\nZona Jobs. \\n\\nTe paso algunas páginas para buscar laburo .\\n\\nJAJAJAJAKA TE QUERES MATAR FRACATELLI',\n",
- " 'Chupate una pija curroteli. Ahora vas a trabajar rata!!',\n",
- " 'Che Branca....que pachoooo? Gano el leon??? No era q se bajaba? Ahajajaja ratas asquerosas...PERDIERON..RATAS ASQUEROSAS...',\n",
- " 'Con el culo roto diría yo.',\n",
- " 'Estás con la cola hecha ???? Nos encantan puta del estado',\n",
- " 'Ya ganó, de que vas a laburar ahora bolsa de estiércol?',\n",
- " 'Se te acabó el currito.... anda a cuna a laburara de mucamo en un hotel.',\n",
- " 'Branca.......vete al coño',\n",
- " 'Ya ganaron salame. Queres un pañuelo? Vas a necesitar 4 años de carilina gilastrun',\n",
- " 'cómo te tiene que estar doliendo la cola branca jajaja empezá a gozar!!',\n",
- " 'Te entró entera y sin lubricante',\n",
- " 'Peor que las Putas sos..',\n",
- " 'Y qué poronga te importa a dónde sale? Qué tenés celos o te arde el culo que él si tiene vida social y vos sos un parásito chupa sangre? Pedazo de bolsa de semen.',\n",
- " 'Y cuál sería tu pelo en el culo ?',\n",
- " 'Vos cerra el ojete, chupa culo de la chorra y andate a la reMiami que te pario que a ti te gusta.',\n",
- " 'Pone la parte donde termina la obra y ellos se sacan fotos con las personas que si valen la pena, los negros siempre tratando de arruinar las cosas, chúpate tres baldes de chotas brancatelli mufasa',\n",
- " 'Que retardado sos, payaso, tenes todo en contra una prosti de mujer, hijos feos y vos un pelotudo',\n",
- " 'Por si o por no, vas a seguir chupando culos?',\n",
- " 'Que berreta sos! Pensando diferente a ellos! Vos estás usando a una mujer! Generar bardo',\n",
- " 'Vos entendès bien lo que es salir a cualquier lado y que te caguen a puteadas, sabès bien que eran 5 locas. Vos si sos puteable al cubo',\n",
- " 'a vos te patea hasta tu mujer nardo de cuarta',\n",
- " 'Gordo cornudo, chupa pijas k, espero tengas el pasaporte al día…. Hablando de putas y cornudos: ya hiciste el ADN de tus crías?',\n",
- " 'Escóndete ahora rata askerosa',\n",
- " 'Una girada gordo eso, te queres matar, se te acaba el sobre',\n",
- " 'Como te quedó la cola????',\n",
- " 'Chupame la pija bien chupada',\n",
- " 'Insoportable el marido de.',\n",
- " 'Métanse la limada en el medio del ogt, @ertenembaum',\n",
- " 'Mas temprano arrancaron las Lanatitas con la limada sutil',\n",
- " 'Que se puede esperar de un p3dofilo mas que una manoseada?',\n",
- " 'Compitiendo en el desafío de culorroto']"
- ]
- },
- "execution_count": 6,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "women_h_df = df.loc[(df['women'] == 1) & (df['journalist_genre'] == 'H')]\n",
- "women_h_text = women_h_df['text'].to_list()\n",
- "women_h_text"
- ]
- }
- ],
- "metadata": {
- "kernelspec": {
- "display_name": "elecciones_argentina_2023-1wwx-vGm",
- "language": "python",
- "name": "python3"
- },
- "language_info": {
- "codemirror_mode": {
- "name": "ipython",
- "version": 3
- },
- "file_extension": ".py",
- "mimetype": "text/x-python",
- "name": "python",
- "nbconvert_exporter": "python",
- "pygments_lexer": "ipython3",
- "version": "3.11.4"
- }
- },
- "nbformat": 4,
- "nbformat_minor": 2
-}