Avoimen tiedon kuntakiertue - Open Knowledge Roadshow - Mikkeli 13.10.2014:
Sovelluksia ja viisautta avoimesta tekstidatasta / Timo Honkela, Helsingin yliopisto, Kansalliskirjasto
Jani Heikkinen, Kuntatieto-ohjelman tuotokset sähköisten palveluiden mahdolli...
OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatasta
1. Sovelluksia ja viisautta
avoimesta tekstidatasta
Timo Honkela, 13.10.2014
Timo Honkela
Helsingin yliopisto Mikkeli, 13.10.2014
Nykykielten laitos
Kansalliskirjasto
Digitointi- ja
konservointikeskus
10. Example:
Complexity of
Finnish at the
level of word
forms
Kimmo Koskenniemi (2013):
Johdatus kieliteknologiaan,
sen merkitykseen ja sovelluksiin
(Introduction to language
technology, its significance and
applications)
https://helda.helsinki.fi/bitstream/handle/10138/38503/kt-johd.pdf?sequence=1
Timo Honkela, 13.10.2014
11. Suomen tieteen kartta
Kemia
Bio- ja
ympäristö-tieteet
Fysiikka, muut luonnon-ja
insinööritieteet
Timo Honkela, 13.10.2014
Terveyden tutkimus
Kulttuurin ja
yhteiskunnan
tutkimus
(Honkela & Klami 2007)
12. DIGRA project / OCR-tulosten
jatkojalostus (Mikkeli+Helsinki)
Quality texts
OCR texts
Timo Honkela, 13.10.2014
Language model
Evaluation
Correction
Production
system
Better
texts
http://www.ifla.org/files/assets/newspapers/Geneva_2014/s6-honkela-en.pdf
13. Text mining for peer support
Discussion forum
postings, etc.
User's
input
STYLE
ANALYSIS
TOPIC ANALYSIS SENTIMENT ANALYSIS
Timo Honkela, 13.10.2014
MULTICRITERIA SELECTION PROCESS
Selected stories
User modeling
and analysis of
feedback
EVALUATION
(Honkela, Izzatdust, Lagus 2012)
14. ICA of wellbeing-related terms
Timo Honkela, 13.10.2014
in Reddit texts
(Honkela, Izzatdust, Lagus 2012)
16. Analysis of “health” in the
State of the Union addresses
Timo Honkela, 13.10.2014
Subjects on objects in contexts:
Using GICA method to quantify
epistemological subjectivity.
Timo Honkela, Juha Raitio, Krista Lagus,
Ilari T. Nieminen, Nina Honkela, and Mika Pantzar.
Proc. of IJCNN 2012.