Skip to content

MarionChaff/real-estate-price-prediction-france

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

real-estate-price-prediction-france

ENG:

Real estate price prediction tool based on French data and applied to Saint-Malo (35400, Bretagne)

Building predictive models to estimate real estate prices based on limited property features provided in the state 'DVF' dataset (https://app.dvf.etalab.gouv.fr/).

Three types of model explored:

  • A linear regression using scikit-learn
  • A boosted tree using XGBoost
  • A simple neural network using TensorFlow/Keras

Models input:

  • total surface (feature 'surface_reelle_bati'), in sqm
  • number of rooms (feature 'nombre_pieces_principales'), in #
  • field surface (feature 'surface_terrain'), in sqm
  • position (feature 'longitude', 'latitude')
  • housing type (house=1 or flat=0 - feature 'maison'), 1 or 0

Models output:

  • total price (feature 'valeur_fonciere'), in kEUR

Notebook content:

  • Data import
  • Data preprocessing and scaling
  • Models building, evaluation and comparison

Note on the dataset: The dataset is sourced from DVF data portal, which is openly accessible and provides information on property transactions including transaction price, surface area, location details, and number of rooms. This dataset does not include detailed property conditions or specific features like electrical/plumbing systems, presence of kitchen/bathroom, floor level, brightness, or necessary repairs.


FR :

Outil de prédiction des prix de l'immobilier appliqué à Saint-Malo (35400, Bretagne)

Construction de modèles prédictifs pour estimer les prix immobiliers basés sur des caractéristiques (limitées) des biens fournies dans la base de données gouvernementale 'DVF' (https://app.dvf.etalab.gouv.fr/).

Trois types de modèles explorés :

  • Une régression linéaire avec scikit-learn
  • Un arbre avec XGBoost
  • Un réseau de neurones simple avec TensorFlow

Inputs du modèle :

  • Surface totale (paramètre 'surface_reelle_bati'), en m²
  • Nombre de pièces (paramètre 'nombre_pieces_principales'), en #
  • Surface du terrain (paramètre 'surface_terrain'), en m²
  • Position (paramètres 'longitude', 'latitude')
  • Type de logement (maison=1 ou appartement=0 - paramètre 'maison'), 1 ou 0

Output du modèle :

  • Prix total (paramètre 'valeur_fonciere'), en kEUR

Contenu du notebook :

  • Import des données
  • Preprocessing et scaling des données
  • Construction, évaluation et comparaison des modèles

Remarques sur le jeu de données : il est issu du portail de données DVF, qui est librement accessible et fournit des informations sur les transactions immobilières incluant le prix de transaction, la surface, les détails de localisation et le nombre de pièces. Il n'inclut pas les conditions détaillées des propriétés ou des caractéristiques spécifiques comme par ex. les systèmes électriques/plomberie, la présence de cuisine/salle de bain, l'étage, la luminosité, les réparations nécessaires, etc.

Releases

No releases published

Packages

No packages published