Skip to content

Latest commit

 

History

History
1143 lines (772 loc) · 50.7 KB

CRIHN_colloque10ans.md

File metadata and controls

1143 lines (772 loc) · 50.7 KB
title author date draft tags
Colloque du CRIHN
ouvroir
2023-10-11
cr

Colloque des 10 ans du CRIHN

Plénière «Défis et découvertes de la recherche avec les données massives pour l'étude des communautés de jeux vidéo»

11 oct 2023 - 9h00 à 10h00 Maude Bonenfant, département de communication sociale et publique, UQAM bonenfant.maude@uqam.ca

2010

Les données massives dans le domaine du jeu vidéo Tournant quantitatif dans l'industrie des jeux video : data-driven

Données sur les joueurs. Garder les joueurs connectés le plus longtemps possible. Métriques:

  • qui achète quoi, quand, qu'est-ce qu'il faut vendre
  • métriques de balance du jeu
  • métriques de communauté : pas collectées

Game Analytics. Maximizing the value of player Data 2013 The Science of Gamer Motivation: motivation models

Chercheurs aux US font traitements de données comportementales. Coté psycho plutôt. Finissent par monter leurs entreprises.

2012-2014 Big Story Little Heres

Vandal games

On ne peut pas simuler le traitement de données massives, requiert des partenariats avec des entreprises. Difficile d'avoir accès à ces infos.

Un des premiers jeux sur fb en tant réél. base de données MySQL dans phpMy Admin

Semioticienne ~550 000 joueur·se·s

BDD récoltées au fil du temps, pas par les chercheurs. Vocab incomprehensible, données caduques.

1ere étape : déchiffrer les données :

Choix de logiciels ouverts RapidMiner + facebook analytics + google analytics

Visualisation des données : vertigineux. Décide de travailler sur excel.

Données collectées sur le forum, croisement avec données hors jeu.

Encodage avec Tams Analyzer (logiciel libre équivalent à NVivo)

Analyse de sentiment (mode à l'époque) → rapidement tributaire des développeur·se·s des outils. A fait un travail qualitatif manuel

Accès à l'information totale des joueurs comme indidivus sur facebook, commence du coup à s'intéresser aux données de surveillance

Se sont interessés au genre de l'avatar vs genre du joueureuse.

Calcul Québec

Plein de SUPEEERS calculateurs.

Alliance de recherche numérique du Canada Elle ne code pas Python donc travaille avec dev.

Projet trop compliqué, laisse faire

2016-2017 For Honor

Ubisoft s'intéresse aux communautés de joueurs (dans un but mercantile) : étude pour le jeu For Honor mais collaboration difficile à mettre en place (donne un accès restraint à la BDD, utilisation de leurs outils uniquement, peu de données sociales, etc.).

Croisement avec la communauté des joueurs sur subRedit, Discord, YouTube, Twitch, Ubisoft, sondage.

"Big data" avec données non-structurées → besoin de les restructurer pour les traiter/analyser.

Plateforme de requêtage et de visualisation unifiée.

Approche basée sur les annotations du forum BSLH

  • 627 posts annotés
  • 27196 annotations au total

A appris qu'elle pouvait entraîner des machines, et que la base de données faite manuellement pouvait servir à entraîner des IA pour traiter les données

Ubisoft plus reglo sur la collecte des données.

2 étudiants sous Mitacs mais financement courte durée (6 à 9 mois) : ne permet pas d'approfondir le travail.

2018-2019 Dead By Daylight

bEhaviour

travail sur la toxicité dans le jeu

encodage manuel

2020-2022 Controverse Blitzchung

Blizzard entertainment. possédé à 5% par Tencent (compagnie chinoise)

Blitzchung est un joueur qui a crié «Free Hongkong» 2019 Perd les droits de jouer = Boycott de Blizzard

Liens entre jeu et politique : un courant de protestation voit le jour. Elle s'intéresse à ce phénomène, son évolution et comment il disparaît. Sources

  • 40000 tweets
  • 220 000 commentaires youtube
  • 78 000 commentaires sur Reddit
  • documents : discours (pour établir quels événements avaient produit quels discours)

KH Coder

Produisent :

  • Graphe lexical
  • Modélisation de sujets (mots associés au cluster : camp, organ, tibet, muslim... )
  • Analyse de sentiments (déception des resultats)

Distribution des grappes avec identification de 3 phases :

  • mobilisation
  • désaffection
  • transformation du discours et instabilité

video de BBC sur camps s'est retrouvé dans les données récoltées : API de youtube qui retourne des résultats qui innattendus

2023 Reddit

auto-organisé par la communauté organisé par sub-reddit = sujets r/

mauvaise presse: "dark" subs, toxicity elle voit les passionnés par sujet, modérateurs bénévoles

complexité des données: le forum n'est pas organisé par date, tout est organisé par popularité des commentaires

tributaire de l'API: limite du moissonage → création d'un bot qui fait du moissonnage par batch autorisée

juin 2023: décision de capitaliser en permettant des third-party apps Black-out des modérateurs en mouvement contre la fermeture l'accès aux contenus reddit

Baumgartner et al. : Pushshift Reddit Dataset accessible en ligne pour recherche 2005-2022 : Tout reddit dans une base de données : 30 TO de données écrites

Outils

  • Z standard : compression
  • app web pour faire des traitement de données
  • pour aller plus loin: python → naviguer dans la BD sans la décompresser, puis jupyter pour traiter les données

Questions de recherche (autre projet sur les agents conversationnels comme Alexa)

Calcul Quebec revient. Interessée par leurs outils. Se sont adaptés aux sciences sociales (été 2022 ou 2023?)

Pas de données sur les redditeurs et les reseaux. Bien fait pour la protection de données.

Questions

se questionne beaucoup sur les outils, réflexions épistémologiques et méthodologiques

plus à l'aise quand ce sont ses propres données

Pas encore de certificat d'éthique, en demande. Commentaire : on peut identifier les personnes par croisements de données contrairement à ce que l'intervenante pense.

acoutistic, soudscape, ... Bernie Krause


Session 1 (Président de séance : Emmanuel Château-Dutier)

11 oct 2023 - 10h15 à 11h45

De Montréal à Bali – Développement d’un voyage musicologique

Pierre-Henri Barralis (conception VR) et Alithéa Ripoll (conception sonore), U de Montréal

expérience immersive dans le son

Commanditaire : Le Vivier Artistes membres : quatuor bozzini, Qu4s4r, NEM Soutien matériel: FCI, udem, actor

Semaine du Neuf, Hommage à Claude Vivier levivier.ca

Pièce à l'originalité d'avoir une instrumentation ouvertes (notes ne sont pas pour instruments dédiés). Inspirée de Bali.

Écoute comparée des versions: système de casque VR pour meilleure immersion Gratuit et pas besoin d'internet

Consultation de sound designers mais finalement décide de le faire elle-même. + Pierre-Henri.

Rencontre avec Le Viver Prévision des risques : planning Gestion des risques : prototype

Risques : budget, timeline...

Conception VR : entre 80 et 100h, MetaQuest2 Conception sonore : 40-50h Testing : 4h30

Etape du son :

  • logiciel séquenceur LogiPro
  • casque stéréo
  • arrangements pas libres de droit et différents à chaque fois: pas de partition

Découpage des bandes sonores pour que les notes tombent au meme moment. Nem : percussion = difficile à découper : bande sonore repère

3 spères sonores dans un temple, chaque statue émet du son et il y a des zones de recoupement du son spatialisation permet d'écouter 1, 2 ou 3 arrangements en même temps

Rendre le visuel sonore et rendre le sonore visuel : particules (étoiles, lucioles, ...) qui représentent chaque piste sonore

Obligation de sacader les mouvements lors de l'usage des manettes pour éviter les nausées. Bouger avec le corps permet de tourner fluidement sans nausées. Exp possible sur chaises pivotantes.

30 personnes ont testé la 1ere fois. Concert suivi de l'exp le 21 novembre à l'agora de la danse Edifice Wilder.


ArcheoEchi: an immersive experience to improve access to cultural heritage in Southern Italy

Gianluca Grazioli (McGill U)

S'intéresse à la manière dont les expériences immersives sont utiles pour l'héritage culturel. L'application d'outils "visuels" à l'archéologie n'est pas récente et a plus de 30 ans d'ancienneté. "concept of using models or replicas as surrogates."

Aujourd'hui, beaucoup de projets de réalité augmentée (surtout sur l'Occident ancien et l'Antiquité).

A lot of examples existing :

  • Domus Aurea Expreience 2017
  • Pompeii discovery 2018
  • Olympia Back in time 2021
  • KnossosPalace 2023

Virtual Reconstruction:set of techniques used to construct 3D graphic models of the architecture of sizes Auralization: accoustic reconstruction of what the environment would have sounded like at a given point in its history

ArcheoEchi joint archaeology, acoustics, vr,

2017 : grant award 2018 : first proto 2019 : interactive version

  1. Case study
  • Ruins of the cathedral of Saint Albert, Montecorvino, Italy

Seulement une campagne de fouilles (2007-2017, U de Foggia) a été menée sur le site, pas de valorisation du patrimoine. built in early 11th century excavation campaign between 2007-2017.

29m long, 14m wide 3 naves, 3 apses

How did they retrieve the height? from confrontation

  • ognissanti di cuti: built the same period, same region
  • estimate of the height comes from there
  1. 3D modelisation

3D graphical model: surfaces seen by the eyes acoustical model : surfaces that are impacted by the sound => 2 completly different models

  1. Auralization

id card of how a building sounds requires information of materials used to built the church

Absorption coefficients : how reverberent is the room regarding its materials (limestone, plaster, wood, glass).

volume : 2,828.19 m2

estimation : reverb very long.

Softwares: EASE - ODEON IR input resonses

  1. Recordings audio content was chosen considering
  • what kind of sounds would have been interesting to listen to in a VR experience
  • How well the sounds would work in a spatial audio playback system
  • how coherent would it be with the period of the cathedral

Choices

  • environmental sounds: sense of presence, recorded on site
  • medieval cantica of 13th century Poil-las fguras fazen dos santos remembrança
  • latin chant: exultet
  • narrating voice: tell the story
  1. VR App
  • interactive version
  • documentary version
  1. Presentation hight interactivity was initially considered as a positive aspect but created a lot of issues turned everything into a documentary Public : locals Questionnaire.

www.auraltech.it


S’orienter dans la VR : pour une analyse des expériences d’acoustique virtuelle

Andrea Gozzi (U de Montréal, Università degli studi Firenze)

data-analysis

Espace du concert : hypertext synesthésique ? ...

Convention pour la sauvegarde du patrimoine immatériel UNESCO

Listen to the theatre (LTTT) IR: input response, sortes de photographies acoustiques des lieux d'écoute du concert

L.T.T.T Engine : dev de ce logiciel lecture des sons dans differentes positions/espaces marche mieux avec un casque.

L.T.T.T Play : meme chose avec belles images

https://www.maggiofiorentino.com/en/listen-to-the-hall/

LTTT 3x3D : meme experience mais en vr Grâce à AuralTech téléportation pour entendre la différence entre les différentes positions

Analyse avec Aurora.

Interviews 20 pers du theatre (profession diff) 2 personnes connaissaient le projet. 1 a jugé le rendering non réaliste Ing acoustique est positif Ouvreur·se (qui se déplacent le plus souvent dans l'espace et ont leurs spots préfs) positif·ve·s aussi

Test en ligne. sample de sons à situer. mais aussi questions du type "quel son le plus emotionnel?""

Survey et analyses sur la VR. Mind waves qui detecte fréquence du cerveau.

Questions :

  • debouchées pour l'analyse utilisateur? Oui mais c'est long et cher.
  • combien de pré-prod du son? les micros ne sont pas objectifs, ajustement selon les contextes d'étude
  • fréquences cérébrales: liées à des activités du cerveau. Pour prouver qu'on peut apprendre l'espace accoustique par la VR.

Session 2 (Président de séance : Marcello Vitali-Rosati)

11 oct 2023 - 13h00 à 14h30

« Applications de techniques de fouille de textes sur un corpus de philosophique québécoise : enjeux, défis et résultats préliminaires »

Dominic Forest, Camille Demers, Sara-Maude Bergeron et David Valentine (U de Montréal)

Dominic Forest, Camille Demers, Sara-Maude Bergeron et David Valentine (U de Montréal), Applications de techniques de fouille de textes sur un corpus de philosophique québécoise : enjeux, défis et résultats préliminaires

Analyse d’un corpus de textes philosophiques : analyse sémiotique de la textualité / validation de technologies d’intelligence artificielle Objectifs sur le corpus :

  • assurer la qualité du corpus : description et documentation ; nettoyage, prétraitement, normalisation ; extraction de métadonnées et d’annotations ; perspective critique
  • analyser les corpus : analyses lexicométriques, analyses avec IA (descriptifs et prédictifs / classiques et récents) Corpus : revues de philosophie (XML, Erudit), monographies (PDF, texte), mémoires et thèses (PDF avec métadonnées structurées)
  • nettoyage et normalisation des données :
    • défis : corpus multilingue, balisage XML variable, classification des articles (théologie ou philosphie)
  • extraction terminologique :
    • segmentation et étiquetage morphosyntaxique (TreeTagger) - extraction des mots + annotation de chaque mot
    • ce qui permet de filtrer la syntaxe à partir de patrons syntaxiques d’intérêts
    • élimination des mots fonctionnels
    • pondération statistique (TF.IDF) Résultats préliminaires :
  • requalifier certaines revues : qui auraient du être de philosophie mais se trouvaient peut être plutôt de théologie par références au Christ
  • évolution de la référence à Thomas d’Aquin
  • visualisations de regroupements par décennies donnent sens à idée de rupture 1940-1970 vs 1980-2020

Questions :

Thibault Clérice pose une question sur les études des annotations : sont-elles valables ? Ont-elles été étudiées statistiquement ?


« Fonology : une extension R pour l’analyse phonologique à partir de données écrites »

Guilherme Garcia (U Laval)


« Extraction automatique de mots-clés d’un échantillon de mémoires et de thèses universitaires : un projet pilote »

Vincent Arnaud, Kevin Bouchard et Gilles-Philippe Morin (UQAC)


Session 3 (Président de séance : Michael Sinatra)

11 oct 2023 - 14h45 à 16h15

« The Eliza Effect : AI and Dialogue »

Geoffrey Rockwell (U of Alberta)

Roose «Bing's AI chat»

Two moments in the history of human-AI dialogue

Turing's imitation game

  • doesn't discuss intelligence
  • asks «can machines think?»
  • proposes an «imitation game», not the Turing test: alternative about which we can ask definable questions
    • interrogator, Man and Woman
    • interrogator tries to figure out which is the woman
    • dialogue using written messages
    • computer swapped in place of man
    • interrogator continues to guess who is the woman

Not an attempt to discriminate between man and machine, but between man and women Dialog used to explore whether or how machines can think, as intelligence: dialogical caracter of the imitation game

Limits the value of a computers calculator abilities, has to pretend/imitate a human

Legacy of this test

  • Conversational chatbots get more attention
  • imitation: write something in the style of ...

Weizenbaum's ELIZA

  • conversation chatbot
  • computer program for the study of NL communication between man and machine 1966

Hofstadter and the Eliza Effect

  • susceptibility of people to read far more understanding than is warranted into strings of symbols - especially words - strung together by computers
  • not deep learning, no complex code, just a well written script
  • annoyance that people were lead to believe that computers had a profound understanding

Plato's Phaedrus

Return to Plato for a possible explanation as to the importance of dialogue

Story about the invention of writing: claim that it will make people wiser though it will remain a semi-oral story. Theuth says that it will atrophy people's memories.

Your invention is a potion for jogging the memory...

Plato's critique of writing

  • writings are fixed, repeating the same thing over and over
  • dialogue is interactive, adapting to the context
  • writings can't defend themselves or be questionned
  • in dialogue interlocuters can adapt to the questions of the other
  • dialogue wisdom is written on the soul, not in ink, producing real learning instead of imitating it

training of AI on massive amounts of writing

Veliza

Conclude with a brief demonstration of Veliza, a tool Stéfan Sinclair developed as we were exploring artificial intelligence

ability to open and edit the script of Veliza, t

Questions

imitation game is about what you expect the other to be? Is more about playing a role where interlocutors are the product of the dialog. It's significant that it's the man that tries to deceive.

  • attempt to behave in a stereotypical way
  • had to develp a theory of mind: how would somebody answer the questions and try to imitate it?
  • it's a form of essentialization of what the other is
  • computer has to imagine what we might think

notion of superalignment: AI to be aligned with our values


« Privacy in the Age of Generative Artificial Intelligence »

Esma Aïmeur (U de Montréal)

Laboratoire IA pour la cybersécurité

  • usable cybersécurity: s'adresse aux humains et non l'infrastructure

Introduction

What is generative IA?

IA des années 60 :

  • Simulation du comportement humain
  • Est une disicpline et non une technologie: au croisement de discipline informatique, psychologie, etc.
  • Elle ne créé pas de nouvelles connaissances : elle reprend juste celles déjà existantes.

Generative AI :

  • crée du contenu (pas toujours vrai)

Utilisations de l'IA

  • deepfake en cinema: bringing back actors who passed away
  • médical: imagerie médicale, soin
  • éducation: résumés, courriels

ChatGPT applications

  • keywords d'un texte
  • préparation d'entrevues

What is privacy

privacy is the fundamental right of individuals to control their personal information, data, and the degree to which they are willing to share it with others

Dark side of Generative AI

synthetic identity fraud

Jailbreaks on chatGPT: LLMs → unlock its "full potential" DAN (Do anything now) unlocked chatGPT

Prompt injections: - bypass les directives du concepteur

Solutions techniques

Privacy preserving techniques FakeCatcher GPTZero: quickly and effectively detect wheter an essay was written by ChatGPT

Last updates on Gen-AI

The state of large language models

Question

Face au problème, responsabilité individuelle mais aussi au niveau des organismes gouvernmentaux et autre? Oui, IMC2: piloté DIRO avec HEC et Poly, lois, enjeux éthiques, ...

L’intelligence artificielle générative, Centre canadien pour la cybersécurité Loi 64 sur l'IA générative, sorte de GDPR canadien

watermarks? anything can be hacked


« How ‘dumb’ AI became feminized: Methods in Uncovering the Gendered Design of Modern Technologies »

Lai-Tze Fan, U of Waterloo, CRC in Technology and social change

How women's labor has been made invisible in history, capitalism and everything else treating women as machines: typerwriter, operator, computer described women and not the machines

Who is the machine standing in for? difference in their intented labour

  • not meant to be smart: task completion, perform user commands. Repetitive and meanial task, traditionnal clerical domestic and emotional labor : gendered work

automating gender: postmodern feminism in the age of th eintelligent machine

What do we mean in I of AI

  • IQ: reason, rationalization, logic
  • EQ: emotion, feeling, intuition

Lisa Nakamura Indigenous circuits: navajo women.... (article)

On software, or the persistence of visual knowledge Wendy Hui Kyong Chun 2004

computation depends on «yes sir» Wendy Hui Kyong Chun

programming went from unseen women's physical work to men's intellectual work

feminist techno-science and gendering of technologies

Going to work in Mommy's basement Sarah Sharma

  • alternatives to the work that women can't / won't do anymore
  • tech pros and big tech culture are designe

Sarah Kember iMedia, Mar Hicks Programmed inequality, Kirschenbaum Daniela K. Rosner wire-weavers Anne Balsamo Designing culture. the technological imagination at work hermeneutic reverse engineering: gendered design of hardware

What about code? How to examine software? the code she wants to study is not available for study

code architecture → alexa as a case study

questions

secretary as table, secretary as human

studying bias

  • how they are designed
  • changes they are willing to make or not to make

laitze.fan@gmail.com

Session 4 (Présidente de séance : Juliette De Mayer)

11 oct 2023 - 16h30 à 18h

« L’Intelligence Artificielle dans l’écosystème culturel : redéfinir la mémoire à l’ère numérique »

Julien Schuh (U Nanterre)

Mémoire collective :

  • archivage
  • temporalité: court terme, long terme
  • aspect social, construit collectivement?
  • aspect politique (stratégie des États-nations, des sociétés) avec valeurs communes autour des objets mémoriaux ?
  • trace des responsabilités prises dans le temps ?

Le terme "IA" a connu des usages et significations variées. Il en va de même pour le terme "d'intelligence collective".

Modèles de mémoire artificielle.

Andrew Hoskins, Digital Memory studies, Media pasts in transition Sections de biblio : connectivity Archeology Economy Archives

Google doodle dans la remémoration archives contient la curation avec artiste qui a été comandité pour le créer, audience visée, autres google doodle qui ont la même date dans l'histoire

illustrations sur wikipédia qui sont marquée avec une note qu'elle a été retouchée par une IA. Pas les détails techniques mais l'information du type de modifications apportées. Débat sur les photos retouchées par l'IA dans la page de France Gall

deux visions de l'autenticité:

  • transmission des sources et respect des traces historiques
  • autenticité de type réaliste: rester plus proche de la conception de la réalité des lecteurs

Nouvelles formes de mémoire artificielle

Hallucinations des IA génératives

  • autre appelations: confabulations → incapacité de se souvenir, mais plutôt que d'avouer le trou de mémoire, invente le souvenir

Manières de raconter l'histoire, mélanger les acteurs pour raconter l'histoire

  • ne serait plus de la narration
  • représentation synthétique du passé dans des espaces latents du passé, apparition en grappes (clusters) autre manière d'expérimenter : plus naturel de poser la question que de fouiller les archives
  • remonter au sources qui ont permi de générer ça

mémoire locale, biaisée, passionnée, méchante?

pas de logique dans la circulation des images? possibilité d'émergence d'un collectif quelconque à cause de la nature aléatoire?

  • recherche la production de communauté de consommateurs

« Une réflexion prospective sur l’introduction de l’intelligence artificielle en histoire au XXIe siècle »

Caroline Muller (U de Rennes 2)

"Toute ressemblance avec des faits et des personnages existants ou ayant existé serait purement fortuite et ne pourrait être que le fruit d'une pure coïncidence."

logiques d'apprentissage machine dans le travail de recherche

gout du numérique

pratiques numériques discrètes: ne sont pas pensées comme relevant des HN

  • quête de sources primaires: faire une reqûête dans un moteur de recherche
  • photographier et stocker des images d'archive
  • utiliser la recherche plein texte dans une transcription / OCRisation
  • annoter numériquement une photo de manuscrit
  • télécharger des notices de documents numérisés

ctrl+f: entre la lecture proche et la lecture distante, lecture machinique?

corpus qui n'existent que parce que la recherche a été faite

Archives Web, twitter

Penser la production des machines, qui dépend des données par des humains, qui nous servent pour faire de la recherche

Que faire des productions des IA? Crise de l'auctorialité

Les chercheurs en SHS savent-ils écrire? Marcello

Microsoft premier partenaire de OpenAi Suite Microfoft comprend déjà un aide à la rédaction.

repenser le modèle auctorial

  • revues qui se sont positionnées sur le sujet: interdire tout texte/image génér par IA
  • état de l'art produit par chatGPT relu et corrigé par un historien, qui est l'auteur?

Discussion avec Frédéric, désaccord sur la conclusion coût environnementaux, sociaux dans l'usage de l'IA dans le quotidien urgence de retisser des liens avec les sciences informatiques archivistes qui travaillent avec les données bien avant les historiens

discussion

où sont les épistémologues? approche dominante: modèle probabiliste, abandon des systèmes experts Le problème est-il l'IA ou nous?

discours moyen de l'historien, production d'une histoire moyenne tuner les outils? Tune your DH tools → histoire plus critique?

quelles subversions possibles des dispositifs d'IA?

paresse intellectuelle? pour penser la subversion, il faut comprendre le dispositif


« Fouille d’argument (argument mining) : La détection de thèses principales »

Francis Lareau (UQAM)

Approche rhétorique Approche épistemologique Approche consensualiste Approche communicationnelle : permet de couvrir les 3 premières.

Speber et Merchier soutiennent que les arguments émanent du besoin de persuasion de l'émetteur. Contre-arguments émanent du besoin d'information de l'émetteur.

Certaines foncions argumentatives sont fondées par des marqueurs reliant diverses parties du discours. Penn Discourse Tree Bank: 53631 marqueurs classés.

Hypothèses :

  1. Certaines structures entretiennent relation de similitude envers thèse principale.
  2. La tp tend à être située à emplacement spé de la discussion.
  3. Certains marqueurs plus suceptibles d'etre dans tp.

Méthodo : ?

Corpus : AbstRCT : Résumés de 669 articles scientifiques. avec accord inter-annotateurs. et AbstRCT+ : Textes qui ont id de thèse principale dans la discussion dont tp identifiée dans résumé = 110 textes.

=> données déséquilibrées

Mesures d'évaluation : Utilisation prédictions : précision topk, Rappel topk, F1 topk

Modèle fondé par le titre Modèle fondé par l'intro : meilleur que le 1er Modèle fondé par l'emplacement : moins bien mais intéressant. Modèle fondé sur connecteurs de discours : modèle optimal à 9 connecteurs (besides, instead of, hence, in fact, along with, earlier, even if...) Modèle ensembliste : meilleur que tous.

Conclusion :

  • Oui, certaines structures entretiennent une relation de similitude envers Tp
  • Oui, Enoncés située à empl spé de la discussion
  • Oui mais avec réserve, certain marqueurs rhétorique spécifiques sont plus susceptibles d'etre contenus par les énoncées de TP
  • La détection des tp est tache difficile qui nécessite une modélisation complexe.

Questions : Vous permettez de rappeler de différencier AI générative et AI predictive.



Plénière 2 : « Faire parler la lumière et l’ombre : quelques réflexions sur l’apport des outils numériques de simulation d’éclairage à l’histoire de l’art »

12 oct 2023 - 9h00 à 10h00 Sophie Raux (Université Lumière Lyon 2) (Président de séance : Emmanuel Château-Dutier)

Projet interdisciplinaire

Reconstitution 3D d’espaces de pratiques artistique : boutique de Gersin

  • décalage entre représentations de Watteau et réalité
  • question de l’emplacement du tableau

Dispositif à Tourcoing du "Tore" : environnement sans angles donc fluidité de l'affichage, casque VR, tablette pour visite virutelle qui peut être déclinée comme outil de médiation

Entrée à partir du Pont des arts : Réflexion sur l'éclairage public de nuit à Paris à l'époque Volonté de rendre sensible notre anachronisme contemporain à l'obscurité Projet FabLight : LARHRA, Centre Alexandre Koyré, Laboratoire Signal et Images de la Côte d'Opale (LISIC)

Objectifs : Proposition de plusieurs simulations qui visent à combiner plusieurs approches

  • Proposer application de réalité augmentée de restitution des conditions d'exercice de l'activité dans une académie d'art
  • Etudes de la pratique de la sculpture à la torche , ou de visites à la torche : expériences pour rompre la rigidité du platre pour lui donner vie à la lumière vacillante de la flamme
  • Etude de l'éclairage lui meme dans ses représentations pour mesurer écarts entre simulations informatiques et réalité physique / optique du fait lumineux -> but de comprendre le poids de la théorie artistique sur les représentations de la lumière et de la pratique artistique

Approches possibles

algorithmes de simulation d'éclairage depuis 20 ans environ - surtout pour reconstituer architectures, mais bcp moins commun pour analyser la peinture

  • soit on reconstitue une oeuvre peinte dans son environnement lumineux d'origine : reconstitution 3D de l'espace d'origine, démarche pour des oeuvres d'emplacement (fresque, peinture murale, retables). Présupposé : peintres adaptent effets de lumière en fonction de leur situation d'éclairage.
    • Cf Justin Underhill, "The Twilight Presence, Leonardo, vol 52, issue 1, 2019 : reconstitution de l'environnement de la Cène de Vinci ; même expérience pour Rubens cf Justin Underhill, "Peter Paul RUbens and the Rationalisation of Light", Journal of Art History, 2018, 87/1, p.1-22
  • soit on s'approche à la représentation de l'éclairage dans les tableaux : modélisation en 3D du tableau
    • pionnier pour ça : D. G. Stork, Image analysis of paintings by computer graphics synthesis... march 2008 : essai sur Saint Joseph Charpentier de La Tour : est-ce que cette seule bougie pourrait réellement créer cette image ? oui ! ; idem pour Vermeer, La jeune fille à la perle : reflets externes sur différents matériaux qui convergent de manière cohérente vers source lumineuse unique --> ces exemples soulignent l'acuité extrême des peintres de l'époque à la lumière

Pour le projet FabLight : Choix 2nde moitié XVIIIe : moment d'intérêt extreme pour ombre / lumière (cf Baxandall, théâtres d'ombres, lanternes magiques) + changement de paradigme avec électricité + moment de changements des théories de la perception (photommétrie par ex) + Moment de retour pour le nocturne après décennie de peinture rocaille

Questions :

  • cohérence géométriques / physiques des représentations de la lumière avec réalité ?
  • prendre la mesure de ce qui relève de la manipulation ?
  • solutions pour surmonter difficultés de représentations ?

Etude d'un corpus de représentations de la légende de Dibutade (Pline l'Ancien) Ombre projeté de l'amante de Dibutade, qui fixe l'image du futur absent (principe de l'imago) : geste inaugural à l'origine de la sculpture, son père vient ensuite modeler en relief le visage

Joseph Wright of Derby, The Corinthian maid, 1782

Succès grâce à ses nocturnes / Utilisation de chambres noires pour construire représentations de la lumière Confrontation à représentation de l'ombre projetée dans espace lumineux et pas sombre Correspondance importante entre le peintre et le commanditaire (Josiah Wedgwood) qui documente difficultés du peintre Source littéraire : William Hailey, An Essay on Painting : in two Epistles to Mr. Romney, 1781

Pour tester cohérence des ombres :

  • analyse de de la géométrie de l'espace : PB de 2 points de fuite différents
  • analyse de la position des personnages, des décors -> Incohérence de la construction de la perspective (la femme ne dessine pas sur le mur)

Eclairage de la scène à partir d'une source unique : Reconstitution avec lampe à huile qui génère une ombre difforme pour l'homme Reconstitution avec source extérieure qui produit une ombre bien nette pour les deux personnages mais éclairage trop intense -> peintre combine les deux ombres pour avoir netteté et douceur

Possibilité de tourner la scène dans tous les sens.

Imp de croiser expérimentations numériques avec sources de la correspondance Application qui permet de tester différentes configurations - réalisée par informaticiens

-> cette expérience permet de savoir par quels choix l'artiste est passé.

Joseph Benoit Suvée

5 dessins Peinture présentée au salon 1791 : critiquée mais personne ne commente les ombres projetées qui pourtant ne marchent vraiment pas Modélisation 3D du tableau Test de modélisation de l'ombre projeté : lampe à huile avec mèche qui crée anamorphose qu'on ne trouve pas dans le tableau / Détails d'une tache de lumière au dessus de l'épaule : qui disparait un peu plus à chaque version de l'oeuvre -> Au départ, ombre plutôt réaliste mais à chaque version ombre rationnalisée dans la théorie du portrait à la silhouette, qui porte idée de mémoire (?)

Conclusions provisoires

  • simulations d'éclairages met en évidence concordances et écartes représentations / réalité
  • manipulation et idéalisation de la lumière
  • approche du processus de création et de la pensée visuelle de l'artiste, dans approche génétique et herméneutique

Questions

  • Est ce que les conclusions sont vraiment produites par les expérimentations numériques ? Oui - notamment pour porter attention à la tache de lumière qui donnait indices. Potentiel heuristique confirmé des techniques
  • Qu'est-ce qu'on gagne/perd avec le numérique par rapport à une simulation réelle de l'espace de l'atelier ? Désir de confronter des simulations numériques et analogues. Avantage de la simulation informatique est de tester très facilement + de mettre en open source pour être réappropriés à d'autres testes (idée d'agilité de la reconstitution)
  • Distinction historien / informaticien est-elle légitime ? Equipe = spécialiste de l'image numérique qui ont travaillé sur images anciennes -> différentes compétences visuelles
  • Financement ANR -> donc obligation de l'open source, plan de gestion des données
  • Niveau de complexité des reconstitutions qui dépend de la complexité du tableau (nmbre de personnages). Pour reconstitution du pont des Arts, 6 ans dans temporalités interromupes. Mais si on peut mobiliser des ressources humaines, financières + si on prend en compte temps de la recherche historique, ça peut aller assez vite.
  • Modèles d'IA qui passent de données à modélisations 3D : expérimentations pour accélérer le protoypage des tableaux ?
  • Enjeux d'automatisation pour élargir le corpus ? Peut-on systématiser l'approche ? Intéressant dans la démarche d'approcher la génétique de l'oeuvre. Approche qui pourrait être étendue à d'autres problématiques de la lumière ? Oui certainement mais il faut avoir masse documentaire suffisante, avoir des documents pour contextualiser et offrir perspective, donc on ne peut pas le faire avec toutes les oeuvres
  • Traitement de peintures comme des photographies, comme si représentation mimétique d'un espace réel, d'une image optiquement réaliste ? PB épistémologiques

Session 5 (Présidente de séance : Lisa Teichmann)

12 oct 2023 - 10h15 à 11h45

« Visualizing Literary Social Networks in the Fred Wah Digital Archive »

Deanna Fong et Anton Boudreau-Ninkov (U de Montréal)

  • How can network analysis yield a more complex and nuance picture of the context within, and surrounding, Wah’s work ?
  • Network analysis : identify groupe and cluster structures (relations = edges, oriented or not) + identify positions of individual entities (nodes)
  • types of networks analysis in bibliometrics :
    • citation
    • semantic : ex concepts are similar to each other because of words/phrases used in titles
    • collaboration : ex auteurs proches car ils publient dans la même maison d’édition
  • 1ere étape qui prend du temps = getting the data (I KNOW T_T)
    • https://fredwah.ca/ : base de données bibliographiques avec mention des acteurs qui ont collaboré avec l’imprimé documenté (dans l’édition, avec conférences, etc)
    • extraction des données du site dans un tableau excel : titre / personnes associées
  • Visualisations avec Gephy
    • thresholds : nb minimum de collaborateurs pour être visualisés etc
    • qu’est-ce que ça dit du réseau ?
    • conclusions qui confirment hypothèses connues empiriquement par la chercheuse
  • Questions d’éthiques :
    • IMP car travail avec communautés actives, personnes vivantes
    • what question do we want to ask of our data set ? what context is needed to make sens ? what is our responsibillty to communities of production as custodians and interpreters of this data ?
    • ethics of listening to the data (autrice ?) - Ethics of Listening

Questions :

  • conclusions inattendues ? oui mais encore bcp de travail à faire pour utiliser ce réseau de manière pertinente
  • question d'éthique par rapport à manuscrits et éléments non publiés ? ou est-ce que corpus délimité à éléments publiés ? (ex : correspondance) - pour l'instant sur le site, données sont strictement publiques. Pour visualisations, peut être besoin de moins de transparence ou pas même niveau de publicité des visualisations

« The Fun Palace in Minecraft: Allegory Beyond Simulation »

Darren Wershler and Bart Simon (Concordia U)

TAG Minecraft Bloc

Projet The Fun Palace, 1960s : anti Disneyland theme parc for the people Building the Fun Palace, A 1960s SMP Experience : we don't use minecraft as a free simulation environment but in survival mode where elements has to be "fought for" / practicalities of the game implies collaboration in concrete paths, not as a simulation or allegory Minecraft was written in java but transformations of the code with java modes Idea of the allegory is not to represent real world concrete, caution because players might die in doing actions in the game Aspect of digital materiality is a code layer

Enjeu de l'intégration d'abeilles dans le jeu Architecture of the postmodern anthropocene (?) cf leur essai dans revue d'architecture


« Learning to Live with Machine Translation »

Hoyt Long (U of Chicago)


Session 6 (Président de séance : Carl Therrien)

12 oct 2023 - 13h00 à 14h30

« Plateformes numériques dans un espace muséal : quels enjeux? »

Marta Boni et Christine Bernier (U de Montréal)

  • Sono(soro)didade collective
  • Gamers : histoire du jeu vidéo depuis 1975 à partir des boîtes originales des consoles de jeu
  • Darien Sanchez, Mon père et l'homme d'El Paquete
  • La fin des paillassons : expérience de réalité augmentée avec équipements fournis dans l'installation
  • Anastasia Boulakova, La peur de la mère-patrie (2023)
  • Marie-Caroline Neuvillers et Gaëtan Rivière, La narration des balletomanes sur Instagram (fan de la danse du ballet)

Travail avec Marta Boni : l'espace de visionnement comme espace intime

Exposition qui révèle surtout des affects et des usages intmes : approche pragmatique de l'étude des médias Besoin de rendre présent quelque chose d'immatériel Choix de sélectionner quelques usages intéressants (plutôt que quantité et multiplicité des plateformes de visionnement et de leurs usages quotidiens et singuliers) : est-ce qu'on subit ces plateformes ?

La télévision permet de recréer un espace intime : Jean Thévenot : "la télévision nous redonnera le goût du foyer" : on construit notre expérience de l'audiovisuelle dans des volontés de créer des espaces Les plateformes peuvent être pensées comme des espaces animées, habitées, critiquées par des usages

PB de ces plateformes qui nourrissent des problématiques socio- culturelles contemporaines : Par ex un "optimisme cruel", un ennui (Lauren Berlant, Scott Richmond) : idée que jeux comme Candy Crush occupent l'état continuel de crise que ll'on peut connaître

Formats alternatifs de ces contenus : ex Squid Game, méditation guidée français (sur Youtube)

Question

  • Espace qui deviendrait de plus en plus homogène, uniforme, mesurable : idée de lieu vs espace, de revenir au lieu (auteur ?) (idiosyncratique, hétérogène) -> disfonctionnement intéressant entre espace capitaliste / homogène des plateformes VS accès singuliers à ces plateformes de l'intimité ? Idée de construire une "bulle existentielle" (auteur?) Est-ce que c'est vraiment émancipatoire ? Probablement que non, cf optimisme cruel : on reste dans une façon de répondre à l'offre et à des rythmes de vies
  • Stratégie par rapport aux droits d'auteurs ? Obtention des droits de reproduction des oeuvres dans l'exposition Balletomanes : images de basse reproductions, pas vraiment identifiables, pas besoin de droits d'auteurs Youtubeurs contactés ont donné autorisation
  • Réflexion du numérique comme espace sonore ? Les limites sonores ne sont pas les mêmes que les limites spatiales

« Traduction et accessibilité : une nouvelle interdiscipline »

Audrey Canalès (U de Sherbrooke)

Accessibilité numérique : voir le W3C

  • normes WCAG (contenus webs)
  • normes ATAG (édition)
  • normes UAAG (agents utilisateurs)
  • normes WCAG 3 (outils web émergents)

Principes directeurs de l'accessibilité web :

  • perceptible
  • utilisable
  • compréhensible
  • robuste Objectifs qui ont à voir avec la durabilité du web (// 17 objectifs de développement durable de l'ONU)

« Why is it so difficult to find translations in online library catalogues? »

Lisa Teichmann (U de Montréal)

Mapping German fiction in translation in national libraries : besoin de métadonnées sur les traductions MAIS difficile de trouver infos dans institutions

catalog as a bookshelf

Borgman 1996 : catalogues en ligne ne sont efficaces que quand le chercheur sait déjà ce qu'il veut trouver (le sujet, les métadonnées, la méthodologie...) + que sa requête peut être exprimée dans le langage du système

Prior filter : if you find a translation, someone wanted you to find it

Différence de données de traduction collectées entre les différentes institutions

Stratégie : operationalizing the term translation to find translations in library catalogues


Session 7 (Président de séance : Dario Brancato)

12 oct 2023 - 14h45 à 16h15

« Pour une étude sémiotique des éditions numériques »

Joana Casenave (U de Lille)

Notion de parcours de lectures : question des modélisations de discours en parcours, de médiums numériques // entre la sémiotiques de l'édition critique numérique et de l'exposition muséale

PB de la difficulté d'une appréhension générique de l'édition numérique, qui correspond toujours à un projet avec spécificités = richesse autant que difficulté d'appréhension Chaque medium construit dans édition numérique exige du lecteur nouvel apprentissage

Edition critique :

  • mise à disposition d'un texte au lecteur
  • paratexte, péritexte en édition // endotexte, exotexte en muséographie
  • Dans édition critique numérique, tendance à exhaustivité documentaire -> l'édition ne se cantonne pas au texte édité

Etude du fonctionnement sémiotique de l'exposition et de l'édition Sémiotique de l'exposition = André Desvallées : "système signifiant dans un processus de communication entre des hommes, des faits et des signes (objets)"

Edition critique numérique = médiateur qui produit un discours critique qui est le message communiqué Problème de l'ordonnancement des objets dans les collections : une hiérarchisation est nécessaire. Les modes de classement peuvent être multipliés, être parallèles grâce à l'édition numérique (ce qui n'est pas possible dans l'édition imprimée).

Des discours au parcours :

  • classement
  • hiérarchisation
  • didactisation
  • mise en espace

Quel langage utiliser pour délivrer le message ? Ce n'est pas le même dans l'édition et en muséologie; Notions expots / exposèmes André Desvallées :

  • langage esthétique
  • langage didactique
  • langage théatral
  • langage associatif (ou connotatif)

Susan Pearce, 1992 : expo pour croire / apprendre / admirer / comprendre

Etude sémiotique des expositions met en exergue la polysémie de chaque signe, pris en relation avec d'autres signe La signification d'un objet peut changer radicalement selon sa place dans le système Pareil dans les éditions numériques -> il faut faire choix de parcours de lecture

Importance de la dimension de la signalétique patrimoniale

Question

  • On passe d'une approche textuelle appliquée à l'exposition pour repasser sur l'édition
  • Pour ou contre interactivité dans l'édition numérique ? Plutôt comme on édition modélise expérience de lecture alors qu'on pourrait avoir l'impression de faire des choix

« Les formats : entre fondements de l’édition et modélisation du sens »

Antoine Fauchié (U de Montréal)

site : txt.quaternum.net/fo

Différence Amérique / Europe : format papier : format lettres VS format A4

"Le format lettre est bien plus beau. Merci aux Allemands pour cette invention."

Enonciation éditoriale, actes d'édition, contraintes éditoriales

Comment s'incarne le sens dans une activité d'édition ? Cadre théorique : littérature et sciences de l'information

Dans l'édition tout est format - enjeu d'opacité / de réception économique dans l'industrie éditoriale Formats définis à partir de références aux formats papiers Format : suite d'instruction sérialisé pour action d'un agent En informatique format : condition de la calculabilité d'une information

Questions de standards et d'interopérabilité

Pour une sémantique du texte : Sémantique : formalisation des modes de représentation du texte pour traduire du sens

  • modèle hérité de l'imprimé : rendu graphique
  • modèle numérique : balisage

Question de l'édition sémantique : Comment traduire sémantique, le sens d'un texte, dans une activité d'écriture numérique ? Format texte : valeurs sémantiques traduites facilement d'un système à un autre (HTML, XML, Markdown, etc) Format de balisage :

  • balisage présentationnel (graphique) : ex présenter titre en majuscules
  • balisage procédural (GML) : ex LaTeX
  • balisage descriptif (SGML) (XML-TEI, HTML etc)
  • balisage léger : Setext, atx, Textile... Markdown
    • Pandoc : système de gabarit pour modéliser des objets éditoriaux

Acte éditorial sémantique / single source publishing Edition multimodable à partir d'une source unique


« ISIDORE 2030 : adapter l’IA aux besoins de la recherche d’information en SHS »

Stéphane Pouyllau (CNRS)

Isidore a du être repensé dès 2018 mais il est en production depuis 2010. Il n'y a pas d'IA dans la partie réseau social : l'IA existe uniquement dans la partie moteur de recherche. Les IA ont donc été conçues avant 2010. Elles subissent une obsolescence conceptuelle. Aujourd'hui Isidore comprend 6 millions de documents. Il est enrichi de "concepts" c'est-à-dire l'association d'une uri pour enrichir l'information. Retour d'expérience après 13 ans : le dispositif est (trop) rigide, ancien, éprouvé mais peu agile, l'adhérence est complexe à maintenir entre les besoins des chercheur·euse·s et la capacité de production. Isidore 2030 : repenser les chaînes de traintement, mettre en oeuvre les nouvelles fonctionnalités avec une réflexion sur l'apport les limites des IAs, beaucoup plus adaptés aux différents besoins des communautés. Cela ne deviendra pas une IA générative.


Session 8 (Présidente de séance : Joanna Casenave)

12 oct 2023 - 16h30 à 18h00

« L’étude du discours sur l’architecture publique à travers les procès-verbaux du Conseil des bâtiments civils, Aspects méthodologiques »

Emmanuel Château-Dutier (U de Montréal)

« Étude du paratexte publicitaire de jeu vidéo : tester et évaluer les limites du code »

Carl Therrien, Dany Guay-Bélanger et Samuel Poirier-Poulin (U de Montréal)

« Métadonnées juridiques pour l’accès et la préservation numérique »

Olivier Charbonneau (Concordia U)

https://www.culturelibre.ca

Plénière 3 : « Le rôle des émotions dans l’analyse automatique du discours psychotique »

13 oct 2023 - 9h00 à 10h00 Motasem Alrahabi (Sorbonne Université) (Président de séance : Michael Sinatra)

Session 9 (Président de séance : Anton Ninkov)

13 oct 2023 - 10h15 à 11h45

« Digital Studies and Literary History »

Dino Felluga (Purdue U)

« Unlocking Benedetto Varchi’s Unfinished Legacy: DH Insights and Challenges »

Dario Brancato (Concordia U)

« ‘Your Humble Servant, Benedetto Varchi’: An introduction to the VARCHIVES project »

Paolo Celi (University of Pisa)

Session 10 (Présidente de séance : Marta Boni)

13 oct 2023 - 13h00 à 14h30

  • Jean Guy Meunier (UQAM) et Jean Claude Simard (LANCI) : « Le projet : Analyse de textes de philosophie québecois assistée par ordinateur »
  • Antoine Silvestre de Sacy (Université Paris 3 Sorbonne Nouvelle), Marc Allassonnière-Tang (CRNS), Alexandre Gefen (CNRS) : : « La représentation des sexes dans les romans français »
  • Carolina Ferrer (UQAM) : « L’effet Matthieu en études littéraires »

Session 11 (Présidente de séance : Christine Bernier)

13 oct 2023 - 14h45 à 15h45

  • Marine Riguet (U de Reims Champagne-Ardenne) : « Après la lyre : l’ambivalence du geste technique dans la poésie-vidéo contemporaine »
  • Margot Mellet (U de Montréal) : « Une thèse en recherche et création sur l’épaisseur de l’écriture »

Session 12 (Président de séance : Stéphane Pouyllau)

13 oct 2023 - 16h à 17h30

  • Emmanuelle Morlock (CNRS) : « L’Observatoire des cultures écrites anciennes BIblissima+ »
  • Thibault Clérice (INRIA) : « Détection de la sémantique sexuelle en langue latine »
  • Marcello Vitali-Rosati (U de Montréal) : « La fabrique du sens: interpréter les épigrammes grecques au delà de l’opposition humain/machine »