Skip to content

Commit

Permalink
Merge pull request #23 from lejafar/add-data
Browse files Browse the repository at this point in the history
Add data
  • Loading branch information
lejafar authored May 6, 2020
2 parents 16cccf5 + 5c827bc commit 14d3fce
Show file tree
Hide file tree
Showing 6 changed files with 15 additions and 1 deletion.
2 changes: 2 additions & 0 deletions .gitattributes
Original file line number Diff line number Diff line change
Expand Up @@ -5,3 +5,5 @@ factrank/data/model/factnet.options.yml filter=lfs diff=lfs merge=lfs -text
factrank/data/model/factnet.statement-processor.pth filter=lfs diff=lfs merge=lfs -text
factrank/data/model/full_set.log filter=lfs diff=lfs merge=lfs -text
"factrank/data/word_embeddings/**/*" filter=lfs diff=lfs merge=lfs -text
factrank/legacy/data/sentences_dump_28.12.csv filter=lfs diff=lfs merge=lfs -text
"factrank/data/training/*.csv" filter=lfs diff=lfs merge=lfs -text
3 changes: 3 additions & 0 deletions factrank/data/training/statements_test.csv
Git LFS file not shown
3 changes: 3 additions & 0 deletions factrank/data/training/statements_train.csv
Git LFS file not shown
3 changes: 3 additions & 0 deletions factrank/data/training/statements_val.csv
Git LFS file not shown
3 changes: 3 additions & 0 deletions factrank/legacy/data/sentences_dump_28.12.csv
Git LFS file not shown
2 changes: 1 addition & 1 deletion ui/src/content/nl/about.md
Original file line number Diff line number Diff line change
Expand Up @@ -37,7 +37,7 @@ FactRank begon als project van Brecht Laperre, Ivo Merchiers en [Rafael Hautekie

Als eerste stap ontwikkelden ze een algoritme dat automatisch feitelijke beweringen kon identificeren die een factcheck waard waren. Als zulke beweringen betrouwbaar kunnen worden geïdentificeerd, kunnen ze worden doorgestuurd naar het volgende stadium van het factcheckproces, waarin ze worden geverifieerd.

Voor de detectie van ‘checkwaardige’ claims werd een machine learning systeem op basis van [1800 met de hand geclassificeerde beweringen](https://github.com/factrank/FactRank/blob/master/data/sentences_dump_28.12.csv) getraind om van beweringen te voorspellen hoe waarschijnlijk het was dat ze checkwaardig zijn.
Voor de detectie van ‘checkwaardige’ claims werd een machine learning systeem op basis van [1800 met de hand geclassificeerde beweringen](https://github.com/factrank/FactRank/blob/master/factrank/legacy/data/sentences_dump_28.12.csv) getraind om van beweringen te voorspellen hoe waarschijnlijk het was dat ze checkwaardig zijn.

Dit leverde een werkend prototype op dat gedurende 2019 werd verbeterd: de tool is nauwkeuriger en put uit een grotere dataset gelabelde beweringen. Dit is mogelijk gemaakt door een [subsidie](https://www.vlaamsjournalistiekfonds.be/500000-euro-subsidie-voor-innoverende-journalistiek) van € 39.869 die FactRank in december 2018 ontving van het Vlaams Journalistiek Fonds.

Expand Down

0 comments on commit 14d3fce

Please sign in to comment.