SlideShare une entreprise Scribd logo
1  sur  49
Concept- en
definitie extractie
       Rinke Hoekstra
      Radboud Winkels
  Universiteit van Amsterdam
Regulation A   Art 12   Art 14, lid 3, 2e volzin
start



                                                            State Name
                                                   entry/action
                                                   do/activity               action
                                                                                      State
                                                   exit/action
                                                   event/action(arguments)



                                                                                              end




Regulation A   Art 12   Art 14, lid 3, 2e volzin
start



                                                            State Name
                                                   entry/action
                                                   do/activity               action
                                                                                      State
                                                   exit/action
                                                   event/action(arguments)



                                                                                              end




Regulation A   Art 12   Art 14, lid 3, 2e volzin
start



                                                            State Name
                                                   entry/action
                                                   do/activity               action
                                                                                      State
                                                   exit/action
                                                   event/action(arguments)



                                                                                              end




Regulation A   Art 12   Art 14, lid 3, 2e volzin
start



                                                            State Name
                                                   entry/action
                                                   do/activity               action
                                                                                      State
                                                   exit/action
                                                   event/action(arguments)



                                                                                              end




Regulation A   Art 12   Art 14, lid 3, 2e volzin
start



                                                                                   State Name
                                                                          entry/action
                                                                          do/activity               action
                                                                                                             State
                                                                          exit/action
                                                                          event/action(arguments)



                                                                                                                     end




Regulation A   Art 12   Art 14, lid 3, 2e volzin   Art 14, lid 3, 2e volzin
start



                                                                                      State Name
                                                                             entry/action
                                                                             do/activity               action
                                                                                                                State
                                                                             exit/action
                                                                             event/action(arguments)



                                                                                                                        end




 Regulation A       Art 12 Art 14, lid 3, 2e volzin   Art 14, lid 3, 2e volzin
(01-01-2011)    (04-02-2011)   (11-06-2008)               (01-07-2011)
Overzicht
• Basisvereisten voor semantisch verrijken

• Concept extractie

• Definitie extractie

• Analyse

• Demo
Wat willen we
           kunnen?
•   “Deserializeren” van regelingen
    (e.g. topic-based browsen, verwijzingen rijgen)

•   Annoteren van regelingen
    (gereconstrueerde metadata, metadata van derden)

•   Annoteren met regelingen
    (processen, services, kennisbestanden, documenten ...)

•   Toegankelijk en herbruikbaar voor andere partijen
    (gedeelde vocabulaires, standaard API)

•   Analyseren van informatienetwerk
Mise en Place
• Wetten en regelingen verzamelen en representeren

• Extraheren en reconstrueren van impliciete
  informatie

• Metadata toegankelijk maken

• Identificatie van alle elementen

• Verwijzingen expliciet maken
CEN MetaLex
           “Open XML Interchange Format for Legal
                 and Legislative Resources”
• CEN Workshop Agreement
• Uitwisselingsformaat
• Zeer generische XML elementen
   (hcontainer, block, inline)

• “Content models” geven het soort inhoud weer
   (e.g. chapter, article, sentence)

• Schema uitbreiding mogelijk
• Metadata als RDFa
• Naming convention
                                        http://www.metalex.eu
MetaLex Document Server
 • Alle Nederlandse wet- en regelgeving in CEN MetaLex formaat
    28.981 document versies

 • Metadata in RDF
    113.333.017 triples

 • Elke nacht bijgewerkt vanuit BWB (wetten.nl API)

 • “Versiebewuste” identificatie van alle elementen

 • Persistente identificatie van alle elementen

 • Extractie van verwijzingsstructuren

                                         http://doc.metalex.eu
Taak
Taak
Taak
Taak
Conceptextractie
   Artikel 10, lid 9
   Het eerste lid is mede van toepassing, indien tot het vermogen van de erflater een schuld
   behoort, die is ontstaan als gevolg van een uiterste wil, voor zover de nominale waarde
   van die schuld meer bedraagt dan de waarde [...]




• Voor elk artikel, ontleed elke zin afzonderlijk

• Elke naamwoordzin verwijst naar een concept

• Elk zelfstandig naamwoord verwijst naar een
  concept

• Elk zelfstandig naamwoord dat binnen een
  naamwoordzin voorkomt, verwijst naar een
  algemener concept dan de naamwoordzin.
Representatie
•   Simple Knowledge Organization System (SKOS)

•   Concepten worden gerepresenteerd als skos:Concept

•   Concepten hebben hiërarchische skos:broader relaties

•   Concepten worden gekoppeld aan de vindplaats door
    dcterms:subject relaties

•   Samen voorkomende concepten worden onderling gekoppeld
    met ma:cooccursWith relaties

•   Concepten worden gekoppeld aan een thesaurus door
    skos:exactMatch relaties
Princeton
                                                                                                                                                     Wordnet
                                                                                        testator                    [...]




                                                                                                                                                     Cornetto
                                                                                                                                                     Wordnet
vermogen                                  vermogen
                    weten                                         capaciteit            legator                    erflater
  (geld)                                 (het kunnen)


                                        skos:closeMatch                                  skos:closeMatch

                                                                                                                                       aanspraken
                                          vermogen                                      erflater




                                                                                                                                                           MetaLex Annotator
                                                                                                               ma:cooccursWith
           skos:relatedMatch                                                                                                              aard
                                                          skos:broader   skos:broader                               ma:cooccursWith

                                                                                                                                       algemeen
                                                          vermogen van de erflater                                    ma:cooccursWith
                                                                                                                                         belang

                                                                                                                     ma:cooccursWith
                                                                                                                                          [...]


                               dcterms:subject                  dcterms:subject              dcterms:subject




                                                                                                                                                    Document
                                                                                                                                                     MetaLex
                           SW                                       SW                                SW




                                                                                                                                                      Server
                   Hoofdstuk I, Artikel 10                  Hoofdstuk I, Artikel 13          Hoofdstuk III, Artikel 32
Versiebeheer
Versiebeheer

vermogen van de erflater




     dcterms:subject



         SW
 Hoofdstuk I, Artikel 10
     2011-01-01
Versiebeheer

vermogen van de erflater




     dcterms:subject



         SW
 Hoofdstuk I, Artikel 10
     2011-01-01


       owl:sameAs


        SHA1
  8738ef273ea4dbc73
Versiebeheer

vermogen van de erflater




     dcterms:subject



         SW                        SW
 Hoofdstuk I, Artikel 10   Hoofdstuk I, Artikel 10
     2011-01-01                2011-10-12


       owl:sameAs


        SHA1
  8738ef273ea4dbc73
Versiebeheer

vermogen van de erflater




     dcterms:subject



         SW                                     SW
 Hoofdstuk I, Artikel 10                Hoofdstuk I, Artikel 10
     2011-01-01                             2011-10-12


       owl:sameAs          owl:sameAs


        SHA1
  8738ef273ea4dbc73
Versiebeheer

vermogen van de erflater




     dcterms:subject         dcterms:subject




         SW                                            SW
 Hoofdstuk I, Artikel 10     owl:sameAs        Hoofdstuk I, Artikel 10
     2011-01-01                                    2011-10-12


       owl:sameAs          owl:sameAs


        SHA1
  8738ef273ea4dbc73
Versiebeheer

vermogen van de erflater




     dcterms:subject         dcterms:subject




         SW                                            SW
 Hoofdstuk I, Artikel 10     owl:sameAs        Hoofdstuk I, Artikel 10
     2011-01-01                                    2011-10-12


       owl:sameAs          owl:sameAs                owl:sameAs


        SHA1                                          SHA1
  8738ef273ea4dbc73                            a433f53273c78a56f2
Versiebeheer

vermogen van de erflater




     dcterms:subject



         SW                        SW
 Hoofdstuk I, Artikel 10   Hoofdstuk I, Artikel 10
     2011-01-01                2011-10-12


       owl:sameAs                owl:sameAs


        SHA1                      SHA1
  8738ef273ea4dbc73        a433f53273c78a56f2
Verwijzingsniveau
  vermogen van de erflater
Verwijzingsniveau
  vermogen van de erflater



      Successiewet
                            dcterms:subject   Successiewet
  vermogen van de erflater
Verwijzingsniveau
  vermogen van de erflater



      Successiewet
                            dcterms:subject      Successiewet
  vermogen van de erflater



      SW Hoofdstuk I                                  SW
                            dcterms:subject
  vermogen van de erflater                          Hoofdstuk I



      SW Artikel 10                                   SW
                            dcterms:subject
  vermogen van de erflater                     Hoofdstuk I, Artikel 10


                                                       SW
     SW Art. 10, zin 1                        Hoofdstuk I, Artikel 10
                            dcterms:subject
  vermogen van de erflater                             Zin 1
Resultaten
• Herkennen van begrippen is doenbaar
  (nog aardig wat false positives, vnl. te lange begrippen)

• Samenvoegen van enkelvoud en meervoud nog
  problematisch

• Juiste niveau van koppelen aan bron nog te kiezen

• Annotatieomgeving (?)
Definitie Extractie
 • Voor elk artikel, ga op zoek naar patronen
          Onder verkrijging krachtens erfrecht wordt voor de toepassing van deze wet
          mede verstaan de verkrijging van vergunningen en aanspraken bij of na het
          overlijden van de erflater indien die verkrijging rechtstreeks verband houdt met
          de omstandigheid dat de erflater die of dergelijke vergunningen en aanspraken
          bezat.




 Begrip        verkrijging krachtens erfrecht


Definitie       de verkrijging van vergunningen en aanspraken bij of na het overlijden van de erflater


Modifier        mede


 Scope         voor de toepassing van deze wet


Conditie       die verkrijging rechtstreeks verband houdt met de omstandigheid ...
• Evaluatie Successiewet

  • 16 correcte vondsten

  • 2 false positives

  • 20 gemiste definities

  • 34 gemiste ficties
Problemen
• Ficties
  “wordt geacht”, “worden aangemerkt als” en “wordt beschouwd als”,
  “wordt onder ... begrepen”, “worden vermoed te zijn”, “wordt
  bepaald alsof” en “worden op dezelfde wijze behandeld als”


• Lijsten

• Gemiste kansen (bug?)
  “Onder schenking wordt niet begrepen...”,
  “Voor de toepassing van deze wet en de daarop berustende
  bepalingen worden de landen van het Koninkrijk der Nederlanden
  aangemerkt als afzonderlijke mogendheden.”
Resultaten
• Dertig patronen voor standaardzinnen

• Recall is momenteel ongeveer 50% (nare bug)

• Precision is redelijk (op Successiewet)

• Precision is erg slecht op breder corpus

• Uitbreiden naar ficties?

• Conclusie: (sc)haalbaarheid is een open vraag
Analyse
• Verwijzingen tussen artikelen

  • Inzicht in belang van artikelen

  • Inzicht in belangrijke schakel artikelen

• Cooccurrence van begrippen

  • Identificatie van thema’s

• Samenvallen verwijzingsstructuur en thema?
Analyse
                   Eigenschappen van een netwerk
                          Dichtheid van het netwerk. Dichtheid van 1 = alle knopen
       Density
                                         zijn met elkaar verbonden

     Modularity                Clusters van onderling sterk gerelateerde knopen

                         Onafhankelijke clusters van onderling zeer sterk gerelateerde
     Small World
                                                   knopen



            Eigenschappen van individuele knopen
  Degree Centrality                          Aantal verwijzingen

    In/Out Degree                 Aantal inkomende/uitgaande verwijzingen

                          Belangrijkheid van knoop op ‘kortste paden’ tussen andere
Betweenness Centrality
                                                  knopen
WJZ




                                          BW
                      SW
                                         Boek 4, Art. 13
WaJong
           IB
 WIA                       WBRV
                                   WPO
                                   WVP


     WLB


                 IV
     AWB Art 4
Discussie
• Concepten herkennen gaat goed

• Definities extraheren gaat nog moeizaam

• Netwerkanalyse biedt perspectief

  • Impactanalyse van wijzigingen

  • Uitbreiden met meer soorten documenten?
     beleidsnotities, uitvoeringsbesluiten

  • TFIDF op concept co-occurrence
DEMO

Contenu connexe

Plus de Rinke Hoekstra

Linked (Open) Data - But what does it buy me?
Linked (Open) Data - But what does it buy me?Linked (Open) Data - But what does it buy me?
Linked (Open) Data - But what does it buy me?
Rinke Hoekstra
 
Linked Science - Building a Web of Research Data
Linked Science - Building a Web of Research DataLinked Science - Building a Web of Research Data
Linked Science - Building a Web of Research Data
Rinke Hoekstra
 
Semantic Representations for Research
Semantic Representations for ResearchSemantic Representations for Research
Semantic Representations for Research
Rinke Hoekstra
 
SIKS 2011 Semantic Web Languages
SIKS 2011 Semantic Web LanguagesSIKS 2011 Semantic Web Languages
SIKS 2011 Semantic Web Languages
Rinke Hoekstra
 
The MetaLex Document Server - Legal Documents as Versioned Linked Data
The MetaLex Document Server - Legal Documents as Versioned Linked DataThe MetaLex Document Server - Legal Documents as Versioned Linked Data
The MetaLex Document Server - Legal Documents as Versioned Linked Data
Rinke Hoekstra
 
Making Sense of Design Patterns
Making Sense of Design PatternsMaking Sense of Design Patterns
Making Sense of Design Patterns
Rinke Hoekstra
 
ODaF 2010 Linked Data in the Netherlands
ODaF 2010 Linked Data in the NetherlandsODaF 2010 Linked Data in the Netherlands
ODaF 2010 Linked Data in the Netherlands
Rinke Hoekstra
 
Overzicht BEST Project - NWO Site Visit
Overzicht BEST Project - NWO Site VisitOverzicht BEST Project - NWO Site Visit
Overzicht BEST Project - NWO Site Visit
Rinke Hoekstra
 
BestPortal: Lessons Learned in Lightweight Semantic Access to Court Proceedings
BestPortal: Lessons Learned in Lightweight Semantic Access to Court ProceedingsBestPortal: Lessons Learned in Lightweight Semantic Access to Court Proceedings
BestPortal: Lessons Learned in Lightweight Semantic Access to Court Proceedings
Rinke Hoekstra
 
BestMap: Context-Aware SKOS Vocabulary Mappings in OWL 2
BestMap: Context-Aware SKOS Vocabulary Mappings in OWL 2BestMap: Context-Aware SKOS Vocabulary Mappings in OWL 2
BestMap: Context-Aware SKOS Vocabulary Mappings in OWL 2
Rinke Hoekstra
 

Plus de Rinke Hoekstra (20)

Linkitup: Link Discovery for Research Data
Linkitup: Link Discovery for Research DataLinkitup: Link Discovery for Research Data
Linkitup: Link Discovery for Research Data
 
A Network Analysis of Dutch Regulations - Using the Metalex Document Server
A Network Analysis of Dutch Regulations - Using the Metalex Document ServerA Network Analysis of Dutch Regulations - Using the Metalex Document Server
A Network Analysis of Dutch Regulations - Using the Metalex Document Server
 
Linked (Open) Data - But what does it buy me?
Linked (Open) Data - But what does it buy me?Linked (Open) Data - But what does it buy me?
Linked (Open) Data - But what does it buy me?
 
Linked Science - Building a Web of Research Data
Linked Science - Building a Web of Research DataLinked Science - Building a Web of Research Data
Linked Science - Building a Web of Research Data
 
COMMIT/VIVO
COMMIT/VIVOCOMMIT/VIVO
COMMIT/VIVO
 
Semantic Representations for Research
Semantic Representations for ResearchSemantic Representations for Research
Semantic Representations for Research
 
A Slightly Different Web of Data
A Slightly Different Web of DataA Slightly Different Web of Data
A Slightly Different Web of Data
 
The Knowledge Reengineering Bottleneck
The Knowledge Reengineering BottleneckThe Knowledge Reengineering Bottleneck
The Knowledge Reengineering Bottleneck
 
Linked Census Data
Linked Census DataLinked Census Data
Linked Census Data
 
SIKS 2011 Semantic Web Languages
SIKS 2011 Semantic Web LanguagesSIKS 2011 Semantic Web Languages
SIKS 2011 Semantic Web Languages
 
The MetaLex Document Server - Legal Documents as Versioned Linked Data
The MetaLex Document Server - Legal Documents as Versioned Linked DataThe MetaLex Document Server - Legal Documents as Versioned Linked Data
The MetaLex Document Server - Legal Documents as Versioned Linked Data
 
Querying the Web of Data
Querying the Web of DataQuerying the Web of Data
Querying the Web of Data
 
History of Knowledge Representation (SIKS Course 2010)
History of Knowledge Representation (SIKS Course 2010)History of Knowledge Representation (SIKS Course 2010)
History of Knowledge Representation (SIKS Course 2010)
 
Making Sense of Design Patterns
Making Sense of Design PatternsMaking Sense of Design Patterns
Making Sense of Design Patterns
 
Publicatie van Linked Open Overheids Data
Publicatie van Linked Open Overheids DataPublicatie van Linked Open Overheids Data
Publicatie van Linked Open Overheids Data
 
ODaF 2010 Linked Data in the Netherlands
ODaF 2010 Linked Data in the NetherlandsODaF 2010 Linked Data in the Netherlands
ODaF 2010 Linked Data in the Netherlands
 
Overzicht BEST Project - NWO Site Visit
Overzicht BEST Project - NWO Site VisitOverzicht BEST Project - NWO Site Visit
Overzicht BEST Project - NWO Site Visit
 
Semantic Modelling using Semantic Web Technology
Semantic Modelling using Semantic Web TechnologySemantic Modelling using Semantic Web Technology
Semantic Modelling using Semantic Web Technology
 
BestPortal: Lessons Learned in Lightweight Semantic Access to Court Proceedings
BestPortal: Lessons Learned in Lightweight Semantic Access to Court ProceedingsBestPortal: Lessons Learned in Lightweight Semantic Access to Court Proceedings
BestPortal: Lessons Learned in Lightweight Semantic Access to Court Proceedings
 
BestMap: Context-Aware SKOS Vocabulary Mappings in OWL 2
BestMap: Context-Aware SKOS Vocabulary Mappings in OWL 2BestMap: Context-Aware SKOS Vocabulary Mappings in OWL 2
BestMap: Context-Aware SKOS Vocabulary Mappings in OWL 2
 

Concept- en Definitie Extractie

  • 1. Concept- en definitie extractie Rinke Hoekstra Radboud Winkels Universiteit van Amsterdam
  • 2.
  • 3. Regulation A Art 12 Art 14, lid 3, 2e volzin
  • 4. start State Name entry/action do/activity action State exit/action event/action(arguments) end Regulation A Art 12 Art 14, lid 3, 2e volzin
  • 5. start State Name entry/action do/activity action State exit/action event/action(arguments) end Regulation A Art 12 Art 14, lid 3, 2e volzin
  • 6. start State Name entry/action do/activity action State exit/action event/action(arguments) end Regulation A Art 12 Art 14, lid 3, 2e volzin
  • 7. start State Name entry/action do/activity action State exit/action event/action(arguments) end Regulation A Art 12 Art 14, lid 3, 2e volzin
  • 8. start State Name entry/action do/activity action State exit/action event/action(arguments) end Regulation A Art 12 Art 14, lid 3, 2e volzin Art 14, lid 3, 2e volzin
  • 9. start State Name entry/action do/activity action State exit/action event/action(arguments) end Regulation A Art 12 Art 14, lid 3, 2e volzin Art 14, lid 3, 2e volzin (01-01-2011) (04-02-2011) (11-06-2008) (01-07-2011)
  • 10. Overzicht • Basisvereisten voor semantisch verrijken • Concept extractie • Definitie extractie • Analyse • Demo
  • 11. Wat willen we kunnen? • “Deserializeren” van regelingen (e.g. topic-based browsen, verwijzingen rijgen) • Annoteren van regelingen (gereconstrueerde metadata, metadata van derden) • Annoteren met regelingen (processen, services, kennisbestanden, documenten ...) • Toegankelijk en herbruikbaar voor andere partijen (gedeelde vocabulaires, standaard API) • Analyseren van informatienetwerk
  • 12. Mise en Place • Wetten en regelingen verzamelen en representeren • Extraheren en reconstrueren van impliciete informatie • Metadata toegankelijk maken • Identificatie van alle elementen • Verwijzingen expliciet maken
  • 13. CEN MetaLex “Open XML Interchange Format for Legal and Legislative Resources” • CEN Workshop Agreement • Uitwisselingsformaat • Zeer generische XML elementen (hcontainer, block, inline) • “Content models” geven het soort inhoud weer (e.g. chapter, article, sentence) • Schema uitbreiding mogelijk • Metadata als RDFa • Naming convention http://www.metalex.eu
  • 14. MetaLex Document Server • Alle Nederlandse wet- en regelgeving in CEN MetaLex formaat 28.981 document versies • Metadata in RDF 113.333.017 triples • Elke nacht bijgewerkt vanuit BWB (wetten.nl API) • “Versiebewuste” identificatie van alle elementen • Persistente identificatie van alle elementen • Extractie van verwijzingsstructuren http://doc.metalex.eu
  • 15. Taak
  • 16. Taak
  • 17. Taak
  • 18. Taak
  • 19. Conceptextractie Artikel 10, lid 9 Het eerste lid is mede van toepassing, indien tot het vermogen van de erflater een schuld behoort, die is ontstaan als gevolg van een uiterste wil, voor zover de nominale waarde van die schuld meer bedraagt dan de waarde [...] • Voor elk artikel, ontleed elke zin afzonderlijk • Elke naamwoordzin verwijst naar een concept • Elk zelfstandig naamwoord verwijst naar een concept • Elk zelfstandig naamwoord dat binnen een naamwoordzin voorkomt, verwijst naar een algemener concept dan de naamwoordzin.
  • 20. Representatie • Simple Knowledge Organization System (SKOS) • Concepten worden gerepresenteerd als skos:Concept • Concepten hebben hiërarchische skos:broader relaties • Concepten worden gekoppeld aan de vindplaats door dcterms:subject relaties • Samen voorkomende concepten worden onderling gekoppeld met ma:cooccursWith relaties • Concepten worden gekoppeld aan een thesaurus door skos:exactMatch relaties
  • 21. Princeton Wordnet testator [...] Cornetto Wordnet vermogen vermogen weten capaciteit legator erflater (geld) (het kunnen) skos:closeMatch skos:closeMatch aanspraken vermogen erflater MetaLex Annotator ma:cooccursWith skos:relatedMatch aard skos:broader skos:broader ma:cooccursWith algemeen vermogen van de erflater ma:cooccursWith belang ma:cooccursWith [...] dcterms:subject dcterms:subject dcterms:subject Document MetaLex SW SW SW Server Hoofdstuk I, Artikel 10 Hoofdstuk I, Artikel 13 Hoofdstuk III, Artikel 32
  • 23. Versiebeheer vermogen van de erflater dcterms:subject SW Hoofdstuk I, Artikel 10 2011-01-01
  • 24. Versiebeheer vermogen van de erflater dcterms:subject SW Hoofdstuk I, Artikel 10 2011-01-01 owl:sameAs SHA1 8738ef273ea4dbc73
  • 25. Versiebeheer vermogen van de erflater dcterms:subject SW SW Hoofdstuk I, Artikel 10 Hoofdstuk I, Artikel 10 2011-01-01 2011-10-12 owl:sameAs SHA1 8738ef273ea4dbc73
  • 26. Versiebeheer vermogen van de erflater dcterms:subject SW SW Hoofdstuk I, Artikel 10 Hoofdstuk I, Artikel 10 2011-01-01 2011-10-12 owl:sameAs owl:sameAs SHA1 8738ef273ea4dbc73
  • 27. Versiebeheer vermogen van de erflater dcterms:subject dcterms:subject SW SW Hoofdstuk I, Artikel 10 owl:sameAs Hoofdstuk I, Artikel 10 2011-01-01 2011-10-12 owl:sameAs owl:sameAs SHA1 8738ef273ea4dbc73
  • 28. Versiebeheer vermogen van de erflater dcterms:subject dcterms:subject SW SW Hoofdstuk I, Artikel 10 owl:sameAs Hoofdstuk I, Artikel 10 2011-01-01 2011-10-12 owl:sameAs owl:sameAs owl:sameAs SHA1 SHA1 8738ef273ea4dbc73 a433f53273c78a56f2
  • 29. Versiebeheer vermogen van de erflater dcterms:subject SW SW Hoofdstuk I, Artikel 10 Hoofdstuk I, Artikel 10 2011-01-01 2011-10-12 owl:sameAs owl:sameAs SHA1 SHA1 8738ef273ea4dbc73 a433f53273c78a56f2
  • 30. Verwijzingsniveau vermogen van de erflater
  • 31. Verwijzingsniveau vermogen van de erflater Successiewet dcterms:subject Successiewet vermogen van de erflater
  • 32. Verwijzingsniveau vermogen van de erflater Successiewet dcterms:subject Successiewet vermogen van de erflater SW Hoofdstuk I SW dcterms:subject vermogen van de erflater Hoofdstuk I SW Artikel 10 SW dcterms:subject vermogen van de erflater Hoofdstuk I, Artikel 10 SW SW Art. 10, zin 1 Hoofdstuk I, Artikel 10 dcterms:subject vermogen van de erflater Zin 1
  • 33. Resultaten • Herkennen van begrippen is doenbaar (nog aardig wat false positives, vnl. te lange begrippen) • Samenvoegen van enkelvoud en meervoud nog problematisch • Juiste niveau van koppelen aan bron nog te kiezen • Annotatieomgeving (?)
  • 34. Definitie Extractie • Voor elk artikel, ga op zoek naar patronen Onder verkrijging krachtens erfrecht wordt voor de toepassing van deze wet mede verstaan de verkrijging van vergunningen en aanspraken bij of na het overlijden van de erflater indien die verkrijging rechtstreeks verband houdt met de omstandigheid dat de erflater die of dergelijke vergunningen en aanspraken bezat. Begrip verkrijging krachtens erfrecht Definitie de verkrijging van vergunningen en aanspraken bij of na het overlijden van de erflater Modifier mede Scope voor de toepassing van deze wet Conditie die verkrijging rechtstreeks verband houdt met de omstandigheid ...
  • 35.
  • 36.
  • 37. • Evaluatie Successiewet • 16 correcte vondsten • 2 false positives • 20 gemiste definities • 34 gemiste ficties
  • 38. Problemen • Ficties “wordt geacht”, “worden aangemerkt als” en “wordt beschouwd als”, “wordt onder ... begrepen”, “worden vermoed te zijn”, “wordt bepaald alsof” en “worden op dezelfde wijze behandeld als” • Lijsten • Gemiste kansen (bug?) “Onder schenking wordt niet begrepen...”, “Voor de toepassing van deze wet en de daarop berustende bepalingen worden de landen van het Koninkrijk der Nederlanden aangemerkt als afzonderlijke mogendheden.”
  • 39. Resultaten • Dertig patronen voor standaardzinnen • Recall is momenteel ongeveer 50% (nare bug) • Precision is redelijk (op Successiewet) • Precision is erg slecht op breder corpus • Uitbreiden naar ficties? • Conclusie: (sc)haalbaarheid is een open vraag
  • 40. Analyse • Verwijzingen tussen artikelen • Inzicht in belang van artikelen • Inzicht in belangrijke schakel artikelen • Cooccurrence van begrippen • Identificatie van thema’s • Samenvallen verwijzingsstructuur en thema?
  • 41. Analyse Eigenschappen van een netwerk Dichtheid van het netwerk. Dichtheid van 1 = alle knopen Density zijn met elkaar verbonden Modularity Clusters van onderling sterk gerelateerde knopen Onafhankelijke clusters van onderling zeer sterk gerelateerde Small World knopen Eigenschappen van individuele knopen Degree Centrality Aantal verwijzingen In/Out Degree Aantal inkomende/uitgaande verwijzingen Belangrijkheid van knoop op ‘kortste paden’ tussen andere Betweenness Centrality knopen
  • 42.
  • 43. WJZ BW SW Boek 4, Art. 13 WaJong IB WIA WBRV WPO WVP WLB IV AWB Art 4
  • 44.
  • 45.
  • 46.
  • 47.
  • 48. Discussie • Concepten herkennen gaat goed • Definities extraheren gaat nog moeizaam • Netwerkanalyse biedt perspectief • Impactanalyse van wijzigingen • Uitbreiden met meer soorten documenten? beleidsnotities, uitvoeringsbesluiten • TFIDF op concept co-occurrence
  • 49. DEMO

Notes de l'éditeur

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n
  32. \n
  33. \n
  34. \n
  35. \n
  36. \n
  37. \n
  38. \n
  39. \n
  40. \n
  41. \n
  42. \n
  43. \n
  44. \n
  45. \n
  46. \n
  47. \n
  48. \n
  49. \n
  50. \n
  51. \n
  52. \n
  53. \n
  54. \n
  55. \n
  56. \n
  57. \n
  58. \n
  59. \n
  60. \n
  61. \n
  62. \n