Skip to content
This repository has been archived by the owner on Jun 23, 2024. It is now read-only.

AlanBlanchet/CategorisezAutomatiquementDesQuestions

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Projet disponible sur github

Introduction

  • Auteur : Alan Blanchet
  • Ecole : OpenClassrooms
  • Mentor Ecole : Chemseddine Nabti
  • Tuteur entreprise : Arthur Derathé

Installation

Aller sur StackExchange

Y insérer cette requête :

SELECT TOP 500000 Title, Body, Tags
FROM Posts
WHERE PostTypeId = 1 AND ViewCount > 10 AND Score > 5 AND AnswerCount > 0 AND LEN(Tags) - LEN(REPLACE(Tags, '<','')) >= 5

Lancer la requête puis clicker sur "Download CSV"

Placer le CSV dans le dossier "data"

Lancer la commande (nécessite conda)

poetry install

Il faut ensuite utiliser le kernel créé dans le notebook

FYI

J'ai eu des problèmes pour faire les installations des solutions RAPIDS. Et par la suite c'est ce qui a causé des conflits avec d'autres packages.

J'avais donc volontairement commenté les installations de la section RAPIDS dans mon pyproject.toml. Maintenant ce n'est plus le cas.

Démo

http://oracle.alan-blanchet.fr:8050/ ou http://oc.alan-blanchet.fr:8050/

Voici un répertoire avec du texte à copier/coller si vous êtes en manque d'inspiration

Sinon, allez chercher une question sur Stack Overflow et coller là dans le site

Matériel

Les scripts de ce repo git ont été lancées avec les informations hardware et logiciels suivants :

16GiB System memory
Intel(R) Core(TM) i7-10750H CPU @ 2.60GHz
GeForce RTX 2070 Mobile

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published