Python 2.7: Ingresar en la carpeta donde se encuentre instalado python en mi caso es C:\Python27. Descargar el archivo get-pip del enlace https://bootstrap.pypa.io/get-pip.py dentro.
-
Abrir la consola y poner
cd C:\Python27
-
Para descargar PIP debe ejecutar
python.exe get-pip.py
-
Editar las variables de entorno en Path y poner
C:\Python27 y C:\Python27\Scripts
Librerias
-
Tweepy
pip install tweepy
-
Paquete de seguridad
pip install requests[security]
-
pattern
pip install pattern
-
Nltk
pip install nltk
-
Sklearn
pip install sklearn
-
Numpy
pip install numpy
-
Scipy
pip install scipy
- Cuenta en Twitter
- Descargar la carpeta TallerUPV
Este taller está dividido en dos partes. En la primera parte nos centraremos en el proceso de descarga de tweets usando la libreria Tweepy y en la segunda parte abordaremos el proceso de clasificación de los tweets que hemos descargados, usando el corpus de entrenamiento generado en el caso de estudio "Analisis de contenido de comunicación ciudadana".
Pasos para obtener las credenciales en Twitter
- Ingresar al link https://apps.twitter.com/
- Click en Create New App
- Llenar los datos y dar click en Create your Twitter application
- En la ventana que aparece dar clik en la pestaña Keys and Access Tokens
- Una vez allí, dar click en Create my Access token
- Finalmente tiene todo lo necesario para poder comenzar a trabajar. Los datos a tener en cuenta son: Consumer Key (API Key), Consumer Secret (API Secret), Access Token y Access Token Secret .
Pasos para poner en funcionamiento el código descargado.
- Editar el archivo credencialesTwitter.py y agregarle las credenciales que generamos en el punto anterior.
- Ejecutar el archivo DescargaTwitt.py
- El producto final del punto anterior es un archivo llamado dataTweets.json.
- Se pueden cambiar las cuentas de las que queremos descargar la información, agregandolas en el archivo cuentas.csv, luego se ejecuta el archivo DescargaTwitt.py
Pasos para poner en funcionamiento el código descargado.
- Asegurarse que en la carpeta DescargaTweet se encuentre el archivo dataTweets.json generardo en la parte 1 del taller
- Dentro de la carpeta Clasificacion se encuentra el archivo ClasificacionTaller.py que debemos ejecutar.
- El producto final del punto anterior es un archivo llamado TweetsClasificados.json.
Nota: El taller se realizó con python 2.7 y con las librerias mencionadas en el apartado herramientas. Si durante el proceso de ejecución del código fuente le indica error en las stopwords debe descomentariar la linea de código.
#nltk.download('stopwords')
#nltk.download('punkt')
Que se encuentra en el código normalizacion.py dentro de la carpeta clasificacion.
Si muestra un Warnig sobre la librería sklearning se debe a que el clasificador (archivo.pickle) se generó en una versión anterior.