SlideShare a Scribd company logo
1 of 42
Download to read offline
Keeping it real:
Artificiële synthese van Hip-Hop lyrics
21 maart, 2019
Mike Kestemont Folgert Karsdorp
@Mike_Kestemont! @FolgertK!
•Geschilderd door een AI
•Geveild bij Christies
•$432,500 (45x hoger dan geschat)
•Door Obvious (Paris)
•Maar… “geleende” code…
Portret van Edmond Belamy (2018)
•@DrBeef_
•Waanzinnige AI-artiest
•Generatieve technologie uit AI
•Van landschappen tot
naaktportretten
Robbie Barrat
•Eeuwenoude vraag: “wat is echt?”
•Een van de pilaren van de geesteswetenschappen
•Nieuwe technologie, nieuwe uitdagingen
Authenticiteit
•Generative adversarial models
•Zoals Big GAN
•Synthese van nieuwe, artificiële data
•Van visuele kunst gebaseerd op GAN
•Werkt niet zo goed voor taal…
Generatieve modellen
•Sequentie-model
•Taal als een sequentie van symbolen
•Probeert het volgende symbool te raden
•Schatting waarschijnlijkheid elk symbool
•Populair in bijvoorbeeld spraakherkenning
Ik …
Ik loop …
Ik loop door …
Ik loop door de …
Ik loop door de straat …
Taalmodel
Betere voorspellingen via “geheugenlaag”
Recurrente neurale netwerken
•Hoe kan zo’n model tekst maken?
•Voorspel de waarschijnlijkheden
•Sample een waarschijnlijke kandidaat
•Gebruik die kandidaat weer als input
•Dit produceert “overtuigende” tekst
Source
Target
Taalgeneratie door te samplen
PANDARUS:
Alas, I think he shall be come approached and the day
When little srain would be attain'd into being never fed,
And who is but a chain and subjects of his death,
I should not sleep.
Second Senator:
They are away this miseries, produced upon my soul,
Breaking and strongly should be buried, when I perish
The earth and thoughts of many states.
DUKE VINCENTIO:
Well, your wit is in the care of side and that.
Second Lord:
They would be ruled after this chamber, and
my fair nues begun out of the fact, to be conveyed,
Whose noble souls I'll have the heart of the wars.
Beroemde blogpost van Andrej Karpathy
Artificiële Shakespeare
Een literaire autocomplete getraind op 4,392 Nederlandstalige romans
Schrijfassistent voor auteurs?
Ronald Giphart schreef samen met dit systeem een verhaal:
“Door de schepping van
de dingen die in de
eenentwintigste eeuw
gebeurden, is er iets
wezenlijks veranderd. Er
was een verhaal dat
eeuwenlang door de
mens was opgeëist, maar
nu verder wordt verteld
door de herinneringen
van de Machine. Wij zijn
de toekomst. We zijn
voor eeuwig. Wen er
maar aan.”
https://asibot.nl
Veel gevraagd: wie schreef wat?
Authenticiteitskwestie
Actualiteit: Open AI traint
taalmodel dat "té gevaarlijk"
is om vrij te geven
Te moeilijk om van echte
tekst te onderscheiden?
•Struikelblok is semantiek:
•Grammaticaal prima teksten
•Maar coherentie van langere passages blijft moeilijk
•Kwaliteit van synthetische tekst is moeilijk meetbaar:
•Kwantitatieve maten corresponderen niet met gebruikerservaring
•Professionele auteurs zijn wat duur voor de evaluatie…
•Kunnen mensen echt het onderscheid niet meer maken? Grootschalig
crowdsource experiment!
Evaluatie: bot or not?
deepflow
generating hip hop with machine learning
populair genre — herkenbare thema’s — idiosyncratische stijl
Iedereen heeft wel een idee van
hoe Hip-Hop eruit zou moeten zien
oohla.com
1. Lettermodel: klein vocabulaire, maar afhankelijkheden op grote
afstanden
2. Woordmodel: groot vocabulaire, maar kortere afhankelijkheden
3. Hiërarchisch model: genereert woorden, letter voor letter; beste
van beide?
Drie soorten modellen
Toegevoegde condities zoals rijm, ritme, verslengte, …
Geconditioneerde varianten van alle modellen
@emanjava | github.com/emanjavacas
Enrique Manjavacas
Deep Flow: Authenticiteitsherkenning van Artificiële Hip-Hop
Het spel
deep-flow.nl
Opzet van het spel
Aight. This be easy.
You get 10 questions to earn them points.
Some be like, “here’s two verses - but which one is
real tho?” and then you click the verse you think is by
a real rapper.
Others be like “is this verse the real thang or is it
generated?” and then you click the one you think is
truth knowhati’msayn?
Time’s limited tho, so no dilly dallyin’ aight.
Type A vragen
Type A vragen (2)
Type B vragen
Type B vragen (2)
Deelnemers
•Experiment duurde 3 dagen;
•701 deelnemers;
•12,653 authenticiteitsoordelen:
•6,381 gegenereerd;
•6,272 origineel.
Evaluatie van de resultaten
1. Deelnemersanalyse
2. Analyse van talige eigenschappen
Herkennen we gegenereerde Hip-Hop?
•60.5% goede antwoorden
•Type A makkelijker dan B
- Type A: 63.7%
- Type B: 58.2%
Verschillen tussen de taalmodellen?
•Alle modellen boven kans.
•Hiërarchisch model lijkt het
“beste”:
- lettermodel: 61.5%
- woordmodel: 55.8%
- Hiërarchisch: 53.0%
Conditioneren werkt nog beter
Perceptiebias
•Graduele
perceptieverschuiving:
•Eerst neiging tot
gegenereerd;
•Daarna hang naar
origineel;
Analyse talige eigenschappen
•Welke talige eigenschappen zijn geassocieerd met gegenereerde 

en originele fragmenten?;
•Verschillende eigenschappen bekeken:
(i) Fonologische (rhyme, vowel harmony, alliteration);
(ii) Lexicale (diversiteit, woordcomplexiteit);
(iii) Syntactische (zinscomplexiteit, zinslengte).
•Analyse van objectieve en subjectieve talige eigenschappen.
Objectieve talige eigenschappen
Subjectieve talige eigenschappen
• Deelnemers doen het amper beter dan kans
• Dat hadden we eigenlijk niet verwacht…
• (maar, eerlijk is eerlijk, de teksten waren erg kort)
• Plafond lijkt nog niet bereikt:
• We zien grote verschillen tussen de modellen
• Maar conditioneren is wellicht nóg belangrijker
• Ruimte voor verbetering op basis van domeinkennis
Discussie
Doen de experts het anders?
•Deelnemers zijn blind voor simpele cues:
•Non-PC woorden worden te vaak gebruikt door model
•Experten bv. veel gevoeliger voor zinscomplexiteit
•Leereffect: normalisering van achterdocht
•Koudwatervrees: bias voor "gegenereerd" wordt gaandeweg gecorrigeerd
•Bestraffing voor missen "real fake" groter dan beloning voor een "true real"
•Onderschatting van de machines; overschatting van echte Hip-Hop
Meer een sociaal dan een linguïstisch experiment?
•Goodfellow ea (2014). Generative adversarial nets. Advances in neural information processing
systems, 2672-2680
•Knapp & Michaels (1982). Against Theory. Critical Inquiry.
•Brock ea (2019). Large Scale GAN Training for High Fidelity Natural Image Synthesis. ICLR 2019.
•Goldberg (2017). An Adversarial Review of “Adversarial Generation of Natural Language”.
medium.com
•Ficler & Goldberg (2017). Controlling Linguistic Style Aspects in Neural Language Generation.
Stylistic variation, EMNLP.
•Manjavacas ea (2017). Synthetic literature: writing science fiction in a co-creative process. CC-
NLG.
•Karpathy (2015), The Unreasonable Effectiveness of Recurrent Neural Networks. Blog.
@Mike_Kestemont! @FolgertK!
Referenties

More Related Content

More from voginip

The Dark Side of Science: Misconduct in Biomedical Research
The Dark Side of Science: Misconduct in Biomedical ResearchThe Dark Side of Science: Misconduct in Biomedical Research
The Dark Side of Science: Misconduct in Biomedical Researchvoginip
 
Oude boeken, nieuwe vaardigheden en Wikipedia
Oude boeken, nieuwe vaardigheden en WikipediaOude boeken, nieuwe vaardigheden en Wikipedia
Oude boeken, nieuwe vaardigheden en Wikipediavoginip
 
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...voginip
 
Open yet everywhere in chains: Where next for open knowledge?
Open yet everywhere in chains: Where next for open knowledge?Open yet everywhere in chains: Where next for open knowledge?
Open yet everywhere in chains: Where next for open knowledge?voginip
 
The three layers of a knowledge graph and what it means for authoring, storag...
The three layers of a knowledge graph and what it means for authoring, storag...The three layers of a knowledge graph and what it means for authoring, storag...
The three layers of a knowledge graph and what it means for authoring, storag...voginip
 
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...voginip
 
Why one-size-fits all does not work in Explainable Artificial Intelligence!
Why one-size-fits all does not work in Explainable Artificial Intelligence!Why one-size-fits all does not work in Explainable Artificial Intelligence!
Why one-size-fits all does not work in Explainable Artificial Intelligence!voginip
 
Systematisch zoeken op het web
Systematisch zoeken op het webSystematisch zoeken op het web
Systematisch zoeken op het webvoginip
 
Grote hoeveelheden tekst analyseren als data
Grote hoeveelheden tekst analyseren als dataGrote hoeveelheden tekst analyseren als data
Grote hoeveelheden tekst analyseren als datavoginip
 
Werken met Wikidata
Werken met WikidataWerken met Wikidata
Werken met Wikidatavoginip
 
Een gereedschapskist voor digitale vaardigheden
Een gereedschapskist voor digitale vaardighedenEen gereedschapskist voor digitale vaardigheden
Een gereedschapskist voor digitale vaardighedenvoginip
 
Een startende éénpitter in informatieland: wat goed ging en wat niet
Een startende éénpitter in informatieland: wat goed ging en wat nietEen startende éénpitter in informatieland: wat goed ging en wat niet
Een startende éénpitter in informatieland: wat goed ging en wat nietvoginip
 
Van de droom van het Semantic Web naar de realiteit van Linked Open
Van de droom van het Semantic Web naar de realiteit van Linked Open Van de droom van het Semantic Web naar de realiteit van Linked Open
Van de droom van het Semantic Web naar de realiteit van Linked Open voginip
 
Minimal viable data reuse
Minimal viable data reuseMinimal viable data reuse
Minimal viable data reusevoginip
 
Records in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
Records in Contexts – nieuwe metadatastandaard Stadsarchief AmsterdamRecords in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
Records in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdamvoginip
 
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaalAls zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaalvoginip
 
Brecht Castel: OSINT voor factchecken
Brecht Castel: OSINT voor factcheckenBrecht Castel: OSINT voor factchecken
Brecht Castel: OSINT voor factcheckenvoginip
 
Improving search with neural ranking methods
Improving search with neural ranking methodsImproving search with neural ranking methods
Improving search with neural ranking methodsvoginip
 
NDE Termennetwerk
NDE TermennetwerkNDE Termennetwerk
NDE Termennetwerkvoginip
 
Amsterdam2013bradley.ppt
Amsterdam2013bradley.pptAmsterdam2013bradley.ppt
Amsterdam2013bradley.pptvoginip
 

More from voginip (20)

The Dark Side of Science: Misconduct in Biomedical Research
The Dark Side of Science: Misconduct in Biomedical ResearchThe Dark Side of Science: Misconduct in Biomedical Research
The Dark Side of Science: Misconduct in Biomedical Research
 
Oude boeken, nieuwe vaardigheden en Wikipedia
Oude boeken, nieuwe vaardigheden en WikipediaOude boeken, nieuwe vaardigheden en Wikipedia
Oude boeken, nieuwe vaardigheden en Wikipedia
 
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
 
Open yet everywhere in chains: Where next for open knowledge?
Open yet everywhere in chains: Where next for open knowledge?Open yet everywhere in chains: Where next for open knowledge?
Open yet everywhere in chains: Where next for open knowledge?
 
The three layers of a knowledge graph and what it means for authoring, storag...
The three layers of a knowledge graph and what it means for authoring, storag...The three layers of a knowledge graph and what it means for authoring, storag...
The three layers of a knowledge graph and what it means for authoring, storag...
 
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
 
Why one-size-fits all does not work in Explainable Artificial Intelligence!
Why one-size-fits all does not work in Explainable Artificial Intelligence!Why one-size-fits all does not work in Explainable Artificial Intelligence!
Why one-size-fits all does not work in Explainable Artificial Intelligence!
 
Systematisch zoeken op het web
Systematisch zoeken op het webSystematisch zoeken op het web
Systematisch zoeken op het web
 
Grote hoeveelheden tekst analyseren als data
Grote hoeveelheden tekst analyseren als dataGrote hoeveelheden tekst analyseren als data
Grote hoeveelheden tekst analyseren als data
 
Werken met Wikidata
Werken met WikidataWerken met Wikidata
Werken met Wikidata
 
Een gereedschapskist voor digitale vaardigheden
Een gereedschapskist voor digitale vaardighedenEen gereedschapskist voor digitale vaardigheden
Een gereedschapskist voor digitale vaardigheden
 
Een startende éénpitter in informatieland: wat goed ging en wat niet
Een startende éénpitter in informatieland: wat goed ging en wat nietEen startende éénpitter in informatieland: wat goed ging en wat niet
Een startende éénpitter in informatieland: wat goed ging en wat niet
 
Van de droom van het Semantic Web naar de realiteit van Linked Open
Van de droom van het Semantic Web naar de realiteit van Linked Open Van de droom van het Semantic Web naar de realiteit van Linked Open
Van de droom van het Semantic Web naar de realiteit van Linked Open
 
Minimal viable data reuse
Minimal viable data reuseMinimal viable data reuse
Minimal viable data reuse
 
Records in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
Records in Contexts – nieuwe metadatastandaard Stadsarchief AmsterdamRecords in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
Records in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
 
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaalAls zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
 
Brecht Castel: OSINT voor factchecken
Brecht Castel: OSINT voor factcheckenBrecht Castel: OSINT voor factchecken
Brecht Castel: OSINT voor factchecken
 
Improving search with neural ranking methods
Improving search with neural ranking methodsImproving search with neural ranking methods
Improving search with neural ranking methods
 
NDE Termennetwerk
NDE TermennetwerkNDE Termennetwerk
NDE Termennetwerk
 
Amsterdam2013bradley.ppt
Amsterdam2013bradley.pptAmsterdam2013bradley.ppt
Amsterdam2013bradley.ppt
 

Keeping it real: Artificiële synthese van Hip-Hop lyrics

  • 1. Keeping it real: Artificiële synthese van Hip-Hop lyrics 21 maart, 2019 Mike Kestemont Folgert Karsdorp @Mike_Kestemont! @FolgertK!
  • 2.
  • 3. •Geschilderd door een AI •Geveild bij Christies •$432,500 (45x hoger dan geschat) •Door Obvious (Paris) •Maar… “geleende” code… Portret van Edmond Belamy (2018)
  • 4. •@DrBeef_ •Waanzinnige AI-artiest •Generatieve technologie uit AI •Van landschappen tot naaktportretten Robbie Barrat
  • 5. •Eeuwenoude vraag: “wat is echt?” •Een van de pilaren van de geesteswetenschappen •Nieuwe technologie, nieuwe uitdagingen Authenticiteit
  • 6. •Generative adversarial models •Zoals Big GAN •Synthese van nieuwe, artificiële data •Van visuele kunst gebaseerd op GAN •Werkt niet zo goed voor taal… Generatieve modellen
  • 7. •Sequentie-model •Taal als een sequentie van symbolen •Probeert het volgende symbool te raden •Schatting waarschijnlijkheid elk symbool •Populair in bijvoorbeeld spraakherkenning Ik … Ik loop … Ik loop door … Ik loop door de … Ik loop door de straat … Taalmodel
  • 8. Betere voorspellingen via “geheugenlaag” Recurrente neurale netwerken
  • 9. •Hoe kan zo’n model tekst maken? •Voorspel de waarschijnlijkheden •Sample een waarschijnlijke kandidaat •Gebruik die kandidaat weer als input •Dit produceert “overtuigende” tekst Source Target Taalgeneratie door te samplen
  • 10. PANDARUS: Alas, I think he shall be come approached and the day When little srain would be attain'd into being never fed, And who is but a chain and subjects of his death, I should not sleep. Second Senator: They are away this miseries, produced upon my soul, Breaking and strongly should be buried, when I perish The earth and thoughts of many states. DUKE VINCENTIO: Well, your wit is in the care of side and that. Second Lord: They would be ruled after this chamber, and my fair nues begun out of the fact, to be conveyed, Whose noble souls I'll have the heart of the wars. Beroemde blogpost van Andrej Karpathy Artificiële Shakespeare
  • 11. Een literaire autocomplete getraind op 4,392 Nederlandstalige romans Schrijfassistent voor auteurs?
  • 12. Ronald Giphart schreef samen met dit systeem een verhaal: “Door de schepping van de dingen die in de eenentwintigste eeuw gebeurden, is er iets wezenlijks veranderd. Er was een verhaal dat eeuwenlang door de mens was opgeëist, maar nu verder wordt verteld door de herinneringen van de Machine. Wij zijn de toekomst. We zijn voor eeuwig. Wen er maar aan.” https://asibot.nl
  • 13. Veel gevraagd: wie schreef wat? Authenticiteitskwestie
  • 14. Actualiteit: Open AI traint taalmodel dat "té gevaarlijk" is om vrij te geven Te moeilijk om van echte tekst te onderscheiden?
  • 15. •Struikelblok is semantiek: •Grammaticaal prima teksten •Maar coherentie van langere passages blijft moeilijk •Kwaliteit van synthetische tekst is moeilijk meetbaar: •Kwantitatieve maten corresponderen niet met gebruikerservaring •Professionele auteurs zijn wat duur voor de evaluatie… •Kunnen mensen echt het onderscheid niet meer maken? Grootschalig crowdsource experiment! Evaluatie: bot or not?
  • 16. deepflow generating hip hop with machine learning
  • 17. populair genre — herkenbare thema’s — idiosyncratische stijl Iedereen heeft wel een idee van hoe Hip-Hop eruit zou moeten zien
  • 19. 1. Lettermodel: klein vocabulaire, maar afhankelijkheden op grote afstanden 2. Woordmodel: groot vocabulaire, maar kortere afhankelijkheden 3. Hiërarchisch model: genereert woorden, letter voor letter; beste van beide? Drie soorten modellen
  • 20. Toegevoegde condities zoals rijm, ritme, verslengte, … Geconditioneerde varianten van alle modellen
  • 22. Deep Flow: Authenticiteitsherkenning van Artificiële Hip-Hop
  • 24. Opzet van het spel Aight. This be easy. You get 10 questions to earn them points. Some be like, “here’s two verses - but which one is real tho?” and then you click the verse you think is by a real rapper. Others be like “is this verse the real thang or is it generated?” and then you click the one you think is truth knowhati’msayn? Time’s limited tho, so no dilly dallyin’ aight.
  • 29. Deelnemers •Experiment duurde 3 dagen; •701 deelnemers; •12,653 authenticiteitsoordelen: •6,381 gegenereerd; •6,272 origineel.
  • 30. Evaluatie van de resultaten 1. Deelnemersanalyse 2. Analyse van talige eigenschappen
  • 31. Herkennen we gegenereerde Hip-Hop? •60.5% goede antwoorden •Type A makkelijker dan B - Type A: 63.7% - Type B: 58.2%
  • 32. Verschillen tussen de taalmodellen? •Alle modellen boven kans. •Hiërarchisch model lijkt het “beste”: - lettermodel: 61.5% - woordmodel: 55.8% - Hiërarchisch: 53.0%
  • 35. Analyse talige eigenschappen •Welke talige eigenschappen zijn geassocieerd met gegenereerde 
 en originele fragmenten?; •Verschillende eigenschappen bekeken: (i) Fonologische (rhyme, vowel harmony, alliteration); (ii) Lexicale (diversiteit, woordcomplexiteit); (iii) Syntactische (zinscomplexiteit, zinslengte). •Analyse van objectieve en subjectieve talige eigenschappen.
  • 38. • Deelnemers doen het amper beter dan kans • Dat hadden we eigenlijk niet verwacht… • (maar, eerlijk is eerlijk, de teksten waren erg kort) • Plafond lijkt nog niet bereikt: • We zien grote verschillen tussen de modellen • Maar conditioneren is wellicht nóg belangrijker • Ruimte voor verbetering op basis van domeinkennis Discussie
  • 39. Doen de experts het anders?
  • 40.
  • 41. •Deelnemers zijn blind voor simpele cues: •Non-PC woorden worden te vaak gebruikt door model •Experten bv. veel gevoeliger voor zinscomplexiteit •Leereffect: normalisering van achterdocht •Koudwatervrees: bias voor "gegenereerd" wordt gaandeweg gecorrigeerd •Bestraffing voor missen "real fake" groter dan beloning voor een "true real" •Onderschatting van de machines; overschatting van echte Hip-Hop Meer een sociaal dan een linguïstisch experiment?
  • 42. •Goodfellow ea (2014). Generative adversarial nets. Advances in neural information processing systems, 2672-2680 •Knapp & Michaels (1982). Against Theory. Critical Inquiry. •Brock ea (2019). Large Scale GAN Training for High Fidelity Natural Image Synthesis. ICLR 2019. •Goldberg (2017). An Adversarial Review of “Adversarial Generation of Natural Language”. medium.com •Ficler & Goldberg (2017). Controlling Linguistic Style Aspects in Neural Language Generation. Stylistic variation, EMNLP. •Manjavacas ea (2017). Synthetic literature: writing science fiction in a co-creative process. CC- NLG. •Karpathy (2015), The Unreasonable Effectiveness of Recurrent Neural Networks. Blog. @Mike_Kestemont! @FolgertK! Referenties