SlideShare a Scribd company logo
1 of 233
Mining Patterns in Relational Databases
Wim Le Page




                             16 december 2009
Mining?
Data
Knowledge
selection,
           transformation



database
                                data
                               mining

                        data

                                                    evaluation,
                                                   presentation

                                        patterns



                                                       knowledge
selection,
           transformation



database
                                data
                               mining

                        data

                                                    evaluation,
                                                   presentation

                                        patterns



                                                       knowledge
selection,
           transformation



database
                                data
                               mining

                        data

                                                    evaluation,
                                                   presentation

                                        patterns



                                                       knowledge
selection,
           transformation



database
                                data
                               mining

                        data

                                                    evaluation,
                                                   presentation

                                        patterns



                                                       knowledge
selection,
           transformation



database
                                data
                               mining

                        data

                                                    evaluation,
                                                   presentation

                                        patterns



                                                       knowledge
selection,
           transformation



database
                                data
                               mining

                        data

                                                    evaluation,
                                                   presentation

                                        patterns



                                                       knowledge
selection,
           transformation



database
                                data
                               mining

                        data

                                                    evaluation,
                                                   presentation

                                        patterns



                                                       knowledge
market basket
  analysis
selection,
           transformation



database
                               data
                              mining


                       data
                                               evaluation,
                                              presentation



                                   patterns


                                                  knowledge
shop
              selection,
           transformation



database
                               data
                              mining


                       data
                                               evaluation,
                                              presentation



                                   patterns


                                                  knowledge
shop
              selection,
           transformation



database
                               data
                              mining


                       data
                                               evaluation,
                                              presentation



                                   patterns


                                                  knowledge
shop
              selection,
           transformation



database
                              frequent
                               itemset
                                mining

                       data
                                               evaluation,
                                              presentation



                                   patterns


                                                  knowledge
shop
              selection,
           transformation



database
                              frequent
                               itemset
                                mining

                       data
                                               evaluation,
                                              presentation



                                   patterns


                                                  knowledge
shop
              selection,
           transformation



database
                              frequent
                               itemset
                                mining

                       data
                                               evaluation,
                                              presentation



                                   patterns                  75%




                                                  knowledge
1000
 products
1000
 products

    21000 possible
            itemsets
1000
 products

    21000 possible
             itemsets

            ≈10 301
1000
 products

                   21000 possible
                                                       itemsets

                                          ≈10 301
=1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
efficient
algorithms
Database
Professor
ID   Name       Age   Title
1    Barabas    65    Prof. dr.
2    Gobelijn   65    Prof. dr.
3    Adhemar    10    Prof. dr.
Course
         Professor
                                  ID     Name        SP   Room     Project
ID   Name       Age   Title
                                  1    Databases     60     G010     Y
1    Barabas    65    Prof. dr.
                                  2    Data Mining   30     G005     N
2    Gobelijn   65    Prof. dr.
                                  3        AI        60     G005     Y
3    Adhemar    10    Prof. dr.
                                  4       XML        30     G005     Y
Course
         Professor
                                      ID     Name        SP   Room     Project
ID   Name        Age         Title
                                      1    Databases     60     G010     Y
1    Barabas       65     Prof. dr.
                                      2    Data Mining   30     G005     N
2    Gobelijn      65     Prof. dr.
                                      3        AI        60     G005     Y
3    Adhemar       10     Prof. dr.
                                      4       XML        30     G005     Y




          Student
ID      Name            Age    Sex
1       Marcel          40      M
2        Fanny          19       F
3    Konstantinopel     12      M
4      Charlotte        40       F
5        Vital          56      M
Database
                                                                  Course
         Professor
                                                 ID     Name        SP   Room     Project
ID   Name        Age         Title
                                                 1    Databases     60     G010     Y
1    Barabas       65     Prof. dr.
                                                 2    Data Mining   30     G005     N
2    Gobelijn      65     Prof. dr.
                                                 3        AI        60     G005     Y
3    Adhemar       10     Prof. dr.
                                                 4       XML        30     G005     Y




          Student
ID      Name            Age    Sex
1       Marcel          40      M
2        Fanny          19       F
3    Konstantinopel     12      M
4      Charlotte        40       F
5        Vital          56      M
Database
                                                                  Course
         Professor
                                                 ID     Name        SP   Room     Project
ID   Name        Age         Title
                                                 1    Databases     60     G010     Y
1    Barabas       65     Prof. dr.
                                                 2    Data Mining   30     G005     N
2    Gobelijn      65     Prof. dr.
                                                 3        AI        60     G005     Y
3    Adhemar       10     Prof. dr.
                                                 4       XML        30     G005     Y




          Student
ID      Name            Age    Sex
1       Marcel          40      M
2        Fanny          19       F
3    Konstantinopel     12      M
4      Charlotte        40       F
5        Vital          56      M
Database
                                               Teaches
                                                                               Course
         Professor                      Prof.ID   Course.ID
                                                              ID     Name        SP   Room     Project
ID   Name        Age         Title         1          2
                                                              1    Databases     60     G010     Y
1    Barabas       65     Prof. dr.        1          3
                                                              2    Data Mining   30     G005     N
2    Gobelijn      65     Prof. dr.        2          1
                                                              3        AI        60     G005     Y
3    Adhemar       10     Prof. dr.        2          4
                                                              4       XML        30     G005     Y
                                           3          4




          Student
ID      Name            Age    Sex
1       Marcel          40      M
2        Fanny          19       F
3    Konstantinopel     12      M
4      Charlotte        40       F
5        Vital          56      M
Database
                                               Teaches
                                                                               Course
         Professor                      Prof.ID   Course.ID
                                                              ID     Name        SP   Room     Project
ID   Name        Age         Title         1          2
                                                              1    Databases     60     G010     Y
1    Barabas       65     Prof. dr.        1          3
                                                              2    Data Mining   30     G005     N
2    Gobelijn      65     Prof. dr.        2          1
                                                              3        AI        60     G005     Y
3    Adhemar       10     Prof. dr.        2          4
                                                              4       XML        30     G005     Y
                                           3          4




          Student
ID      Name            Age    Sex
1       Marcel          40      M
2        Fanny          19       F
3    Konstantinopel     12      M
4      Charlotte        40       F
5        Vital          56      M
Database
                                                Teaches
                                                                                Course
         Professor                       Prof.ID   Course.ID
                                                               ID     Name        SP   Room     Project
ID   Name        Age         Title          1            2
                                                               1    Databases     60     G010     Y
1    Barabas       65     Prof. dr.         1            3
                                                               2    Data Mining   30     G005     N
2    Gobelijn      65     Prof. dr.         2            1
                                                               3        AI        60     G005     Y
3    Adhemar       10     Prof. dr.         2            4
                                                               4       XML        30     G005     Y
                                            3            4


                                                 Takes
                                        Student.ID Course.ID
                                            1             1
                                            1             3
                                            2             2
                                            2             4
          Student                           3             1

ID      Name            Age    Sex          3             2

1       Marcel          40      M           3             3
2        Fanny          19       F          3             4
3    Konstantinopel     12      M           4             1
4      Charlotte        40       F          5             3
5        Vital          56      M
Relational Database
                                              Teaches
                                                                              Course
         Professor                     Prof.ID   Course.ID
                                                             ID     Name        SP   Room     Project
ID   Name        Age         Title        1            2
                                                             1    Databases     60     G010     Y
1    Barabas       65     Prof. dr.       1            3
                                                             2    Data Mining   30     G005     N
2    Gobelijn      65     Prof. dr.       2            1
                                                             3        AI        60     G005     Y
3    Adhemar       10     Prof. dr.       2            4
                                                             4       XML        30     G005     Y
                                          3            4


                                               Takes
                                      Student.ID Course.ID
                                          1             1
                                          1             3
                                          2             2
                                          2             4
          Student                         3             1

ID      Name            Age    Sex        3             2

1       Marcel          40      M         3             3
2        Fanny          19       F        3             4
3    Konstantinopel     12      M         4             1
4      Charlotte        40       F        5             3
5        Vital          56      M
selection,
           transformation




database                        data
                               mining
                        data

                                                evaluation,
                                               presentation

                                    patterns



                                                   knowledge
selection,
           transformation




database                        data
                               mining
                        data

                                                evaluation,
                                               presentation

                                    patterns



                                                   knowledge
selection,
             transformation




relational
database                          data
                                 mining
                          data

                                                  evaluation,
                                                 presentation

                                      patterns



                                                     knowledge
selection,
             transformation




relational
database                          data
                                 mining
                          data

                                                  evaluation,
                                                 presentation

                                      patterns



                                                     knowledge
data
       mining




data            patterns
relational
          data
        mining




data                patterns
relational
                data
              mining




relational                relational
   data                    patterns
Queries
Queries

Itemsets
Queries
Queries

Which students are male?
Queries

Which students are male?


                    Which professors teach a
                     course in room G010?
Queries

  Which students are male?


                       Which professors teach a
                        course in room G010?


Which courses have a project and
 are taken by female students?
Queries

Which courses have a project and
 are taken by female students?
Queries

Which courses have a project and
 are taken by female students?
Queries

Which courses have a project and
 are taken by female students?


  SELECT DISTINCT Course.ID
  FROM Course, Takes, Student
  WHERE Course.project = ‘Y’
        AND Student.sex = ‘F’
        AND Student.ID = Takes.StudentID
        AND Course.ID = Takes.CourseID
Queries

Which courses have a project and
 are taken by female students?


  SELECT DISTINCT Course.ID
  FROM Course, Takes, Student
                                             ID    Name       SP   Room   Project
  WHERE Course.project = ‘Y’
                                             1    Databases   60   G010     Y
        AND Student.sex = ‘F’
        AND Student.ID = Takes.StudentID     4      XML       30   G005     Y
        AND Course.ID = Takes.CourseID
Queries



SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
      AND Student.sex = ‘F’
      AND Student.ID = Takes.StudentID
      AND Course.ID = Takes.CourseID
Queries

General
          SELECT DISTINCT Course.ID
          FROM Course, Takes, Student
          WHERE Course.project = ‘Y’
                AND Student.sex = ‘F’
                AND Student.ID = Takes.StudentID
                AND Course.ID = Takes.CourseID
Queries

General                                            Efficient
          SELECT DISTINCT Course.ID
          FROM Course, Takes, Student
          WHERE Course.project = ‘Y’
                AND Student.sex = ‘F’
                AND Student.ID = Takes.StudentID
                AND Course.ID = Takes.CourseID
Queries

General                                            Efficient
          SELECT DISTINCT Course.ID
          FROM Course, Takes, Student
          WHERE Course.project = ‘Y’
                AND Student.sex = ‘F’
                AND Student.ID = Takes.StudentID
                AND Course.ID = Takes.CourseID




Natural
Queries

General                                            Efficient
          SELECT DISTINCT Course.ID
          FROM Course, Takes, Student
          WHERE Course.project = ‘Y’
                AND Student.sex = ‘F’
                AND Student.ID = Takes.StudentID
                AND Course.ID = Takes.CourseID




Natural                                            Flexible
Queries
Queries

  Which students are male?


                       Which professors teach a
                        course in room G010?

Which courses have a project and
 are taken by female students?
Queries

                                                 ID      Name             Age   Sex

  Which students are male?                        1
                                                  3
                                                         Marcel
                                                      Konstantinopel
                                                                          40
                                                                          12
                                                                                 M
                                                                                 M
                                                  5       Vital           56     M




        ID   Name       Age   Title       Which professors teach a
                                           course in room G010?
        2    Gobelijn   65    Prof. dr.




Which courses have a project and                         ID
                                                          1
                                                                   Name
                                                                  Databases
                                                                                SP
                                                                                60
                                                                                      Room
                                                                                      G010
                                                                                             Project
                                                                                               Y

 are taken by female students?                            4         XML         30    G005     Y
Queries

                                                 ID      Name             Age   Sex

  Which students are male?                        1
                                                  3
                                                         Marcel
                                                      Konstantinopel
                                                                          40
                                                                          12
                                                                                 M
                                                                                 M
                                                  5       Vital           56     M




        ID   Name       Age   Title       Which professors teach a
                                           course in room G010?
        2    Gobelijn   65    Prof. dr.




Which courses have a project and                         ID
                                                          1
                                                                   Name
                                                                  Databases
                                                                                SP
                                                                                60
                                                                                      Room
                                                                                      G010
                                                                                             Project
                                                                                               Y

 are taken by female students?                            4         XML         30    G005     Y
Frequent Queries

                                                 ID      Name             Age   Sex

  Which students are male?                        1
                                                  3
                                                         Marcel
                                                      Konstantinopel
                                                                          40
                                                                          12
                                                                                 M
                                                                                 M
                                                  5       Vital           56     M




        ID   Name       Age   Title       Which professors teach a
                                           course in room G010?
        2    Gobelijn   65    Prof. dr.




Which courses have a project and                         ID
                                                          1
                                                                   Name
                                                                  Databases
                                                                                SP
                                                                                60
                                                                                      Room
                                                                                      G010
                                                                                             Project
                                                                                               Y

 are taken by female students?                            4         XML         30    G005     Y
Frequent Queries




Which courses have a project and   ID
                                   1
                                         Name
                                        Databases
                                                    SP
                                                    60
                                                         Room
                                                         G010
                                                                Project
                                                                  Y

 are taken by female students?     4      XML       30   G005     Y
Frequent Queries



                                   ID    Name       SP   Room   Project


 Which courses have a project?     1
                                   3
                                   4
                                        Databases
                                           AI
                                          XML
                                                    60
                                                    60
                                                    30
                                                         G010
                                                         G005
                                                         G005
                                                                  Y
                                                                  Y
                                                                  Y




Which courses have a project and   ID
                                   1
                                         Name
                                        Databases
                                                    SP
                                                    60
                                                         Room
                                                         G010
                                                                Project
                                                                   Y

 are taken by female students?     4      XML       30   G005      Y
Frequent Queries



                                   ID    Name       SP   Room   Project


 Which courses have a project?     1
                                   3
                                   4
                                        Databases
                                           AI
                                          XML
                                                    60
                                                    60
                                                    30
                                                         G010
                                                         G005
                                                         G005
                                                                  Y
                                                                  Y
                                                                  Y




Which courses have a project and   ID
                                   1
                                         Name
                                        Databases
                                                    SP
                                                    60
                                                         Room
                                                         G010
                                                                Project
                                                                   Y

 are taken by female students?     4      XML       30   G005      Y
Frequent Queries

    66% of courses with a project are
       taken by female students

                                   ID    Name       SP   Room   Project


 Which courses have a project?     1
                                   3
                                   4
                                        Databases
                                           AI
                                          XML
                                                    60
                                                    60
                                                    30
                                                         G010
                                                         G005
                                                         G005
                                                                  Y
                                                                  Y
                                                                  Y




Which courses have a project and   ID
                                   1
                                         Name
                                        Databases
                                                    SP
                                                    60
                                                         Room
                                                         G010
                                                                Project
                                                                   Y

 are taken by female students?     4      XML       30   G005      Y
Contained Frequent Queries

    66% of courses with a project are
       taken by female students

                                   ID    Name       SP   Room   Project


 Which courses have a project?     1
                                   3
                                   4
                                        Databases
                                           AI
                                          XML
                                                    60
                                                    60
                                                    30
                                                         G010
                                                         G005
                                                         G005
                                                                  Y
                                                                  Y
                                                                  Y




Which courses have a project and   ID
                                   1
                                         Name
                                        Databases
                                                    SP
                                                    60
                                                         Room
                                                         G010
                                                                Project
                                                                   Y

 are taken by female students?     4      XML       30   G005      Y
pairs of contained
 frequent queries
relational
                data
              mining




relational                pairs of contained
   data                    frequent queries
Conqueror
             Algorithm



relational          pairs of contained
   data              frequent queries
Conqueror
Algorithm
Conqueror
      Algorithm


Generate queries
Conqueror
      Algorithm


Generate queries
Evaluate queries
Conqueror
      Algorithm


Generate queries
Evaluate queries
  Pair queries
Conqueror
Algorithm   Generate queries
Conqueror
Algorithm   Generate queries

Simple Conjunctive Queries
Conqueror
Algorithm         Generate queries

Simple Conjunctive Queries

            A=B
Conqueror
Algorithm         Generate queries

Simple Conjunctive Queries

            A=B

            A>B
Conqueror
Algorithm         Generate queries

Simple Conjunctive Queries

            A=B      R×1

            A>B
Conqueror
Algorithm         Generate queries

Simple Conjunctive Queries

            A=B      R×1

            A>B      R,R
Conqueror
Algorithm   Generate queries
Conqueror
Algorithm             Generate queries




       SELECT DISTINCT Course.ID
       FROM Course, Takes, Student
       WHERE Course.project = ‘Y’
           AND Student.sex = ‘F’
           AND Student.ID = Takes.StudentID
           AND Course.ID = Takes.CourseID
Conqueror
Algorithm             Generate queries

   ⋈            Student.ID = Takes.StudentID
            AND Course.ID = Takes.CourseID




       SELECT DISTINCT Course.ID
       FROM Course, Takes, Student
       WHERE Course.project = ‘Y’
           AND Student.sex = ‘F’
           AND Student.ID = Takes.StudentID
           AND Course.ID = Takes.CourseID
Conqueror
Algorithm             Generate queries

   ⋈            Student.ID = Takes.StudentID
            AND Course.ID = Takes.CourseID




   π            SELECT DISTINCT Course.ID




       SELECT DISTINCT Course.ID
       FROM Course, Takes, Student
       WHERE Course.project = ‘Y’
           AND Student.sex = ‘F’
           AND Student.ID = Takes.StudentID
           AND Course.ID = Takes.CourseID
Conqueror
Algorithm             Generate queries

   ⋈            Student.ID = Takes.StudentID
            AND Course.ID = Takes.CourseID




   π            SELECT DISTINCT Course.ID




   σ             Course.project = ‘Y’
               AND Student.sex = ‘F’


       SELECT DISTINCT Course.ID
       FROM Course, Takes, Student
       WHERE Course.project = ‘Y’
           AND Student.sex = ‘F’
           AND Student.ID = Takes.StudentID
           AND Course.ID = Takes.CourseID
Conqueror
      Algorithm


Generate queries
Evaluate queries
  Pair queries
Conqueror
      Algorithm


Generate queries
Evaluate queries
  Pair queries
Conqueror
      Algorithm


Generate queries
Evaluate queries
  Pair queries
Conqueror
      Algorithm


Generate queries
Evaluate queries
  Pair queries
Conqueror
      Algorithm


Generate queries
Evaluate queries
  Pair queries
Conqueror
      Algorithm


Generate queries
Evaluate queries
  Pair queries
The number of players that play a
  quiz they made themselves?
The number of players that play a quiz they
made themselves and got the maximum score?


     The number of players that play a
       quiz they made themselves?
The number of players that play a quiz they
made themselves and got the maximum score?

                   ≠
     The number of players that play a
       quiz they made themselves?
The number of players that play a quiz they
made themselves and got the maximum score?
            = 86% of
     The number of players that play a
       quiz they made themselves?
The number of players that play a quiz they
made themselves and got the maximum score?
            = 86% of
     The number of players that play a
       quiz they made themselves?

 14% of the players do
     not         maximal
             get a
        score on a quiz they made
               themselves
The number of quizzes that
       are played?
The number of quizzes that
    are played in 2006?

The number of quizzes that
       are played?
The number of quizzes that
    are played in 2006?
     = 91% of
The number of quizzes that
       are played?
The number of quizzes that
      are played in 2006?
       = 91% of
  The number of quizzes that
         are played?

majorityof the quizzes
 were played in 2006
The number of players?
The number of players that
  play a quiz that exists?


 The number of players?
The number of players that
  play a quiz that exists?
          ≠
 The number of players?
The number of players that
  play a quiz that exists?
     = 99% of
 The number of players?
The number of players that
   play a quiz that exists?
        = 99% of
     The number of players?


1%
 of the players play a quiz
   that does     notexist
Queries

Itemsets
Queries

Itemsets
Queries

Itemsets
Itemsets
Itemsets
Itemsets

frequent
 itemset
  mining
Itemsets

frequent
 itemset
  mining
Itemsets
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
1     Y        Y        N       N
2     Y        N        Y       N
3     Y        N        Y       Y
4     Y        Y        Y       Y
5     Y        N        N       N
6     Y        N        Y       Y
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y
12    N        N        Y       Y
Itemsets
          Market Baskets
ID
1
     Bread
      Y
             Butter
               Y
                      Cheese
                        N
                               Wine
                                N
                                      frequent
2     Y        N        Y       N
                                       itemset
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5     Y        N        N       N
6     Y        N        Y       Y
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y
12    N        N        Y       Y
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5     Y        N        N       N
6     Y        N        Y       Y
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y
12    N        N        Y       Y
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12}
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5     Y        N        N       N
6     Y        N        Y       Y
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y
12    N        N        Y       Y
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5     Y        N        N       N
6     Y        N        Y       Y
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y
12    N        N        Y       Y
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y
12    N        N        Y       Y
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y
12    N        N        Y       Y
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y
12    N        N        Y       Y
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
                                                   {3,4,6,9,11,12}
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
                                                   {3,4,6,9,11,12}   6/12 = 50%
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
                                                   {3,4,6,9,11,12}   6/12 = 50%
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
                                                   {3,4,6,9,11,12}   6/12 = 50%
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
                                                   {3,4,6,9,11,12}   6/12 = 50%
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
                                                   {3,4,6,9,11,12}   6/12 = 50%

               {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75%
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
                                                   {3,4,6,9,11,12}   6/12 = 50%

               {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75%
               {(Wine=Y)} ➔ {(Cheese=Y),(Wine=Y)}           6/6 = 100%
Itemsets
          Market Baskets
ID   Bread   Butter   Cheese   Wine
                                      frequent   {(Cheese=Y)}
1     Y        Y        N       N
2     Y        N        Y       N
                                       itemset     {2,3,4,6,7,9,11,12} 8/12 = 67%
                                        mining
3     Y        N        Y       Y
4     Y        Y        Y       Y
5
6
      Y
      Y
               N
               N
                        N
                        Y
                                N
                                Y
                                                 {(Wine=Y)}
                                                   {3,4,6,9,11,12}   6/12 = 50%
7     Y        Y        Y       N
8     N        N        N       N
9     N        Y        Y       Y
10    N        Y        N       N
11    Y        N        Y       Y                {(Cheese=Y), (Wine=Y)}
12    N        N        Y       Y
                                                   {3,4,6,9,11,12}   6/12 = 50%

               {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75%
               {(Wine=Y)} ➔ {(Cheese=Y),(Wine=Y)}           6/6 = 100%

                      association rules
Itemsets
Itemsets


          Student
ID      Name          Age   Sex
1       Marcel        40    M
2        Fanny        19     F
3    Konstantinopel   12    M
4      Charlotte      40     F
5        Vital        56    M
Itemsets

                 Course
ID       Name         SP        Room    Project
1    Databases        60        G010           Y
                                                             Student
2    Data Mining      30        G005           N
3         AI          60        G005           Y   ID      Name          Age   Sex
4         XML         30        G005           Y   1       Marcel        40    M
                                                   2        Fanny        19     F
                                                   3    Konstantinopel   12    M
                Professor                          4      Charlotte      40     F
     ID     Name           Age     Title           5        Vital        56    M
     1      Barabas        65      Prof. dr.
     2     Gobelijn        65      Prof. dr.
     3     Adhemar         10      Prof. dr.
Itemsets

                 Course                                                                                             Takes
ID       Name         SP        Room    Project
                                                                                                            Student.ID Course.ID
1    Databases        60        G010           Y
                                                             Student                         Teaches            1           1
2    Data Mining      30        G005           N
                                                   ID      Name          Age   Sex    Prof.ID   Course.ID       1           3
3         AI          60        G005           Y
4         XML         30        G005           Y   1       Marcel        40    M         1          2           2           2
                                                   2        Fanny        19     F        1          3           2           4
                                                   3    Konstantinopel   12    M         2          1           3           1
                Professor                          4      Charlotte      40     F        2          4           3           2
     ID     Name           Age     Title           5        Vital        56    M         3          4           3           3
     1      Barabas        65      Prof. dr.                                                                    3           4
     2     Gobelijn        65      Prof. dr.                                                                    4           1
     3     Adhemar         10      Prof. dr.                                                                    5           3
Itemsets

                 Course                                                                                             Takes
ID       Name         SP        Room    Project
                                                                                                            Student.ID Course.ID
1    Databases        60        G010           Y
                                                             Student                         Teaches            1           1
2    Data Mining      30        G005           N
                                                   ID      Name          Age   Sex    Prof.ID   Course.ID       1           3
3         AI          60        G005           Y
4         XML         30        G005           Y   1       Marcel        40    M         1          2           2           2
                                                   2        Fanny        19     F        1          3           2           4
                                                   3    Konstantinopel   12    M         2          1           3           1
                Professor                          4      Charlotte      40     F        2          4           3           2
     ID     Name           Age     Title           5        Vital        56    M         3          4           3           3
     1      Barabas        65      Prof. dr.                                                                    3           4
     2     Gobelijn        65      Prof. dr.                                                                    4           1
     3     Adhemar         10      Prof. dr.                                                                    5           3
Itemsets

                 Course                                                                                             Takes
ID       Name         SP        Room    Project
                                                                                                            Student.ID Course.ID
1    Databases        60        G010           Y
                                                             Student                         Teaches            1           1
2    Data Mining      30        G005           N
                                                   ID      Name          Age   Sex    Prof.ID   Course.ID       1           3
3         AI          60        G005           Y
4         XML         30        G005           Y   1       Marcel        40    M         1          2           2           2
                                                   2        Fanny        19     F        1          3           2           4
                                                   3    Konstantinopel   12    M         2          1           3           1
                Professor                          4      Charlotte      40     F        2          4           3           2
     ID     Name           Age     Title           5        Vital        56    M         3          4           3           3
     1      Barabas        65      Prof. dr.                                                                    3           4
     2     Gobelijn        65      Prof. dr.                                                                    4           1
     3     Adhemar         10      Prof. dr.                                                                    5           3
Itemsets

                                          Full Outer Join
S.ID      Name          Age   Sex   C.ID  Name       SP     Room Project P.ID Name Age Title
  1       Marcel         40    M     1   Databases 60        G010   Y      2  Gobelijn 65 Prof. dr.
  1       Marcel         40    M     3       AI      60      G005   Y      1  Barabas 65 Prof. dr.
  2       Fanny          19    F     2   Data Mining 30      G005  N       1  Barabas 65 Prof. dr.
 2         Fanny        19     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 2         Fanny        19     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 3     Konstantinopel   12    M      1    Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12    M      2   Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12    M      4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12    M      4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 4       Charlotte      40     F     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
 4       Charlotte      40     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 4       Charlotte      40     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 5         Vital        56    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
Itemsets

                                          Full Outer Join
S.ID      Name          Age   Sex   C.ID  Name       SP     Room Project P.ID Name Age Title
  1       Marcel         40    M     1   Databases 60        G010   Y      2  Gobelijn 65 Prof. dr.
  1       Marcel         40    M     3       AI      60      G005   Y      1  Barabas 65 Prof. dr.
  2       Fanny          19    F     2   Data Mining 30      G005  N       1  Barabas 65 Prof. dr.
 2         Fanny        19     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 2         Fanny        19     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 3     Konstantinopel   12    M      1    Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12    M      2   Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12    M      4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12    M      4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 4       Charlotte      40     F     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
 4       Charlotte      40     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 4       Charlotte      40     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 5         Vital        56    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
Itemsets

                                          Full Outer Join
S.ID      Name          Age   Sex   C.ID  Name       SP     Room Project P.ID Name Age Title
  1       Marcel         40    M     1   Databases 60        G010   Y      2  Gobelijn 65 Prof. dr.
  1       Marcel         40    M     3       AI      60      G005   Y      1  Barabas 65 Prof. dr.
  2       Fanny          19    F     2   Data Mining 30      G005  N       1  Barabas 65 Prof. dr.
 2         Fanny        19     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 2         Fanny        19     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 3     Konstantinopel   12     M     1    Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12     M     2   Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12     M     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12     M     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12     M     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 4       Charlotte      40     F     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
 4       Charlotte      40     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 4       Charlotte      40     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 5         Vital        56     M     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.


                              frequent
                               itemset
                                mining
Itemsets

                                           Full Outer Join
S.ID      Name          Age   Sex   C.ID  Name       SP      Room Project P.ID Name Age Title
  1       Marcel         40    M     1   Databases 60         G010   Y      2  Gobelijn 65 Prof. dr.
  1       Marcel         40    M     3       AI      60       G005   Y      1  Barabas 65 Prof. dr.
  2       Fanny          19    F     2   Data Mining 30       G005  N       1  Barabas 65 Prof. dr.
 2         Fanny        19     F     4       XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 2         Fanny        19     F     4       XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 3     Konstantinopel   12     M     1     Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12     M     2    Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12     M     3        AI        60   G005     Y      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12     M     4       XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12     M     4       XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 4       Charlotte      40     F     3        AI        60   G005     Y      1   Barabas    65   Prof. dr.
 4       Charlotte      40     F     4       XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 4       Charlotte      40     F     4       XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 5         Vital        56     M     3        AI        60   G005     Y      1   Barabas    65   Prof. dr.


                              frequent
                               itemset
                                mining

                                         {(project=Y)}                    12/14 = 86%
Itemsets

                                           Full Outer Join
S.ID      Name          Age   Sex   C.ID  Name       SP      Room Project P.ID Name Age Title
  1       Marcel         40    M     1   Databases 60         G010   Y      2  Gobelijn 65 Prof. dr.
  1       Marcel         40    M     3       AI      60       G005   Y      1  Barabas 65 Prof. dr.
  2       Fanny          19    F     2   Data Mining 30       G005  N       1  Barabas 65 Prof. dr.
 2         Fanny        19     F     4       XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 2         Fanny        19     F     4       XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 3     Konstantinopel   12     M     1     Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12     M     2    Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12     M     3        AI        60   G005     Y      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12     M     4       XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12     M     4       XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 4       Charlotte      40     F     3        AI        60   G005     Y      1   Barabas    65   Prof. dr.
 4       Charlotte      40     F     4       XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 4       Charlotte      40     F     4       XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 5         Vital        56     M     3        AI        60   G005     Y      1   Barabas    65   Prof. dr.


                              frequent
                               itemset
                                mining

                                         {(project=Y)}                    12/14 = 86% of
                                                                                                             ?
Itemsets

                                          Full Outer Join
S.ID      Name          Age   Sex   C.ID  Name       SP     Room Project P.ID Name Age Title
  1       Marcel         40    M     1   Databases 60        G010   Y      2  Gobelijn 65 Prof. dr.
  1       Marcel         40    M     3       AI      60      G005   Y      1  Barabas 65 Prof. dr.
  2       Fanny          19    F     2   Data Mining 30      G005  N       1  Barabas 65 Prof. dr.
 2         Fanny        19     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 2         Fanny        19     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 3     Konstantinopel   12    M      1    Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12    M      2   Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
 3     Konstantinopel   12    M      4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 3     Konstantinopel   12    M      4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 4       Charlotte      40     F     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
 4       Charlotte      40     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
 4       Charlotte      40     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
 5         Vital        56    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.




✘ frequency has no clear meaning
The Key Idea
The Key Idea
The Key Idea
                                                               Student
              Professor
                                                    ID       Name          Age   Sex
     ID   Name       Age      Title
                                                    1        Marcel        40    M
      1   Barabas    65       Prof. dr.
                                                    2         Fanny        19     F
      2   Gobelijn   65       Prof. dr.
                                                    3     Konstantinopel   12    M
      3   Adhemar    10       Prof. dr.
                                                    4       Charlotte      40     F
                                                    5         Vital        56    M



                                          Course
                     ID      Name           SP   Room      Project
                     1     Databases        60     G010       Y
                     2     Data Mining      30     G005       N
                     3         AI           60     G005       Y
                     4        XML           30     G005       Y
The Key Idea
                                                               Student
              Professor
                                                    ID       Name          Age   Sex
     ID   Name       Age      Title
                                                    1        Marcel        40    M
      1   Barabas    65       Prof. dr.
                                                    2         Fanny        19     F
      2   Gobelijn   65       Prof. dr.
                                                    3     Konstantinopel   12    M
      3   Adhemar    10       Prof. dr.
                                                    4       Charlotte      40     F
                                                    5         Vital        56    M



                                          Course
                     ID      Name           SP   Room      Project
                     1     Databases        60     G010       Y
                     2     Data Mining      30     G005       N
                     3         AI           60     G005       Y
                     4        XML           30     G005       Y
The Key Idea
                                                               Student
              Professor
                                                    ID       Name          Age   Sex
     ID   Name       Age      Title
                                                    1        Marcel        40    M
      1   Barabas    65       Prof. dr.
                                                    2         Fanny        19     F
      2   Gobelijn   65       Prof. dr.
                                                    3     Konstantinopel   12    M
      3   Adhemar    10       Prof. dr.
                                                    4       Charlotte      40     F
                                                    5         Vital        56    M



                                          Course
                     ID      Name           SP   Room      Project
                     1     Databases        60     G010       Y
                     2     Data Mining      30     G005       N
                     3         AI           60     G005       Y
                     4        XML           30     G005       Y
The Key Idea
                                                               Student
              Professor
                                                    ID       Name          Age   Sex
     ID   Name       Age      Title
                                                    1        Marcel        40    M
      1   Barabas    65       Prof. dr.
                                                    2         Fanny        19     F
      2   Gobelijn   65       Prof. dr.
                                                    3     Konstantinopel   12    M
      3   Adhemar    10       Prof. dr.
                                                    4       Charlotte      40     F
                                                    5         Vital        56    M



                                          Course
                     ID      Name           SP   Room      Project
                     1     Databases        60     G010       Y
                     2     Data Mining      30     G005       N
                     3         AI           60     G005       Y
                     4        XML           30     G005       Y
The Key Idea
   S.ID      Name          Age   Sex   C.ID  Name       SP     Room Project P.ID Name Age Title
     1       Marcel         40    M     1   Databases 60        G010   Y      2  Gobelijn 65 Prof. dr.
     1       Marcel         40    M     3       AI      60      G005   Y      1  Barabas 65 Prof. dr.
     2       Fanny          19    F     2   Data Mining 30      G005  N       1  Barabas 65 Prof. dr.
    2         Fanny        19     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    2         Fanny        19     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    3     Konstantinopel   12    M      1    Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel   12    M      2   Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
    3     Konstantinopel   12    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
    3     Konstantinopel   12    M      4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel   12    M      4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    4       Charlotte      40     F     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
    4       Charlotte      40     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    4       Charlotte      40     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    5         Vital        56    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
The Key Idea
                                        {(SP=30)}
   S.ID      Name          Age   Sex   C.ID  Name       SP     Room Project P.ID Name Age Title
     1       Marcel         40    M     1   Databases 60        G010   Y      2  Gobelijn 65 Prof. dr.
     1       Marcel         40    M     3       AI      60      G005   Y      1  Barabas 65 Prof. dr.
     2       Fanny          19    F     2   Data Mining 30      G005  N       1  Barabas 65 Prof. dr.
    2         Fanny        19     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    2         Fanny        19     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    3     Konstantinopel   12    M      1    Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel   12    M      2   Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
    3     Konstantinopel   12    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
    3     Konstantinopel   12    M      4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel   12    M      4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    4       Charlotte      40     F     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
    4       Charlotte      40     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    4       Charlotte      40     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    5         Vital        56    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
The Key Idea
                                        {(SP=30)}
   S.ID      Name          Age   Sex   C.ID  Name       SP     Room Project P.ID Name Age Title
     1       Marcel         40    M     1   Databases 60        G010   Y      2  Gobelijn 65 Prof. dr.
     1       Marcel         40    M     3       AI      60      G005   Y      1  Barabas 65 Prof. dr.
     2       Fanny          19    F     2   Data Mining 30      G005  N       1  Barabas 65 Prof. dr.
    2         Fanny        19     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    2         Fanny        19     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    3     Konstantinopel   12    M      1    Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel   12    M      2   Data Mining   30   G005     N      1   Barabas    65   Prof. dr.
    3     Konstantinopel   12    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
    3     Konstantinopel   12    M      4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel   12    M      4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    4       Charlotte      40     F     3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
    4       Charlotte      40     F     4      XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    4       Charlotte      40     F     4      XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    5         Vital        56    M      3       AI        60   G005     Y      1   Barabas    65   Prof. dr.
The Key Idea
                                        {(SP=30)}
   S.ID      Name          Age   Sex   C.ID  Name       SP        Room Project P.ID Name Age Title
     1       Marcel         40    M     1   Databases 60           G010   Y      2  Gobelijn 65 Prof. dr.
     1       Marcel         40    M     3       AI      60         G005   Y      1  Barabas 65 Prof. dr.
     2       Fanny          19    F     2   Data Mining 30         G005  N       1  Barabas 65 Prof. dr.
    2         Fanny        19     F     4          XML       30   G005     Y      2   Gobelijn   65   Prof. dr.
    2         Fanny        19     F     4          XML       30   G005     Y      3   Adhemar    10   Prof. dr.
    3     Konstantinopel   12    M      1        Databases   60   G010     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel   12    M      2    Data Mining     30   G005     N      1   Barabas    65   Prof. dr.
    3     Konstantinopel   12    M      3           AI       60   G005     Y      1   Barabas    65   Prof. dr.
    3     Konstantinopel   12    M      4          XML       30   G005     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel   12    M      4          XML       30   G005     Y      3   Adhemar    10   Prof. dr.
    4       Charlotte      40     F     3           AI       60   G005     Y      1   Barabas    65   Prof. dr.
    4       Charlotte      40     F     4          XML       30   G005     Y      2   Gobelijn   65   Prof. dr.
    4       Charlotte      40     F     4          XML       30   G005     Y      3   Adhemar    10   Prof. dr.
    5         Vital        56    M      3           AI       60   G005     Y      1   Barabas    65   Prof. dr.
                                       {2,
                                            4}
The Key Idea
                                         {(SP=30)}
   S.ID      Name           Age   Sex   C.ID  Name       SP         Room Project P.ID Name Age Title
     1       Marcel          40    M     1   Databases 60            G010   Y      2  Gobelijn 65 Prof. dr.
     1       Marcel          40    M     3       AI      60          G005   Y      1  Barabas 65 Prof. dr.
     2       Fanny           19    F     2   Data Mining 30          G005  N       1  Barabas 65 Prof. dr.
    2         Fanny         19     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    2         Fanny         19     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    3     Konstantinopel    12    M      1        Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel    12    M      2    Data Mining      30   G005     N      1   Barabas    65   Prof. dr.
    3     Konstantinopel    12    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
    3     Konstantinopel    12    M      4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel    12    M      4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    4       Charlotte       40     F     3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
    4       Charlotte       40     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    4       Charlotte       40     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    5         Vital         56    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
                                        {2,
                                             4}

                                                              of the
                           2/4 =        50% courses
The Key Idea
                                         {(SP=30)}
   S.ID      Name           Age   Sex   C.ID  Name       SP         Room Project P.ID Name Age Title
     1       Marcel          40    M     1   Databases 60            G010   Y      2  Gobelijn 65 Prof. dr.
     1       Marcel          40    M     3       AI      60          G005   Y      1  Barabas 65 Prof. dr.
     2       Fanny           19    F     2   Data Mining 30          G005  N       1  Barabas 65 Prof. dr.
    2         Fanny         19     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    2         Fanny         19     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    3     Konstantinopel    12    M      1        Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel    12    M      2    Data Mining      30   G005     N      1   Barabas    65   Prof. dr.
    3     Konstantinopel    12    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
    3     Konstantinopel    12    M      4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel    12    M      4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    4       Charlotte       40     F     3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
    4       Charlotte       40     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    4       Charlotte       40     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    5         Vital         56    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
                                        {2,
                                             4}

                                                              of the
                           2/4 =        50% courses
The Key Idea
                                         {(SP=30)}
   S.ID      Name           Age   Sex   C.ID  Name       SP         Room Project P.ID Name Age Title
     1       Marcel          40    M     1   Databases 60            G010   Y      2  Gobelijn 65 Prof. dr.
     1       Marcel          40    M     3       AI      60          G005   Y      1  Barabas 65 Prof. dr.
     2       Fanny           19    F     2   Data Mining 30          G005  N       1  Barabas 65 Prof. dr.
    2         Fanny         19     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    2         Fanny         19     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    3     Konstantinopel    12    M      1        Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel    12    M      2    Data Mining      30   G005     N      1   Barabas    65   Prof. dr.
    3     Konstantinopel    12    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
    3     Konstantinopel    12    M      4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel    12    M      4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    4       Charlotte       40     F     3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
    4       Charlotte       40     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    4       Charlotte       40     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    5         Vital         56    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
                                        {2,
                                             4}

                                                              of the
                           2/4 =        50% courses
The Key Idea
                                         {(SP=30)}
   S.ID       Name          Age   Sex   C.ID  Name       SP         Room Project P.ID Name Age Title
     1        Marcel         40    M     1   Databases 60            G010   Y      2  Gobelijn 65 Prof. dr.
     1        Marcel         40    M     3       AI      60          G005   Y      1  Barabas 65 Prof. dr.
     2        Fanny          19    F     2   Data Mining 30          G005  N       1  Barabas 65 Prof. dr.
    2           Fanny       19     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    2           Fanny       19     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    3     Konstantinopel    12    M      1        Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel    12    M      2    Data Mining      30   G005     N      1   Barabas    65   Prof. dr.
    3     Konstantinopel    12    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
    3     Konstantinopel    12    M      4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    3     Konstantinopel    12    M      4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    4         Charlotte     40     F     3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
    4         Charlotte     40     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
    4         Charlotte     40     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
    5           Vital       56    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.

   {2,                                  {2,
        3,4                                  4}
            }
                                                              of the
                           2/4 =        50% courses
The Key Idea
                                                {(SP=30)}
          S.ID       Name          Age   Sex   C.ID  Name       SP         Room Project P.ID Name Age Title
            1        Marcel         40    M     1   Databases 60            G010   Y      2  Gobelijn 65 Prof. dr.
            1        Marcel         40    M     3       AI      60          G005   Y      1  Barabas 65 Prof. dr.
            2        Fanny          19    F     2   Data Mining 30          G005  N       1  Barabas 65 Prof. dr.
           2           Fanny       19     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
           2           Fanny       19     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
           3     Konstantinopel    12    M      1        Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
           3     Konstantinopel    12    M      2    Data Mining      30   G005     N      1   Barabas    65   Prof. dr.
           3     Konstantinopel    12    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
           3     Konstantinopel    12    M      4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
           3     Konstantinopel    12    M      4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
           4         Charlotte     40     F     3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
           4         Charlotte     40     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
           4         Charlotte     40     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
           5           Vital       56    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.

          {2,                                  {2,
               3,4                                  4}
                   }
                                                                     of the
                                  2/4 =        50% courses
                 of the
3/5 =   60% students
The Key Idea
                                                {(SP=30)}
          S.ID       Name          Age   Sex   C.ID  Name       SP         Room Project P.ID Name Age Title
            1        Marcel         40    M     1   Databases 60            G010   Y      2  Gobelijn 65 Prof. dr.
            1        Marcel         40    M     3       AI      60          G005   Y      1  Barabas 65 Prof. dr.
            2        Fanny          19    F     2   Data Mining 30          G005  N       1  Barabas 65 Prof. dr.
           2           Fanny       19     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
           2           Fanny       19     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
           3     Konstantinopel    12    M      1        Databases    60   G010     Y      2   Gobelijn   65   Prof. dr.
           3     Konstantinopel    12    M      2    Data Mining      30   G005     N      1   Barabas    65   Prof. dr.
           3     Konstantinopel    12    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
           3     Konstantinopel    12    M      4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
           3     Konstantinopel    12    M      4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
           4         Charlotte     40     F     3           AI        60   G005     Y      1   Barabas    65   Prof. dr.
           4         Charlotte     40     F     4          XML        30   G005     Y      2   Gobelijn   65   Prof. dr.
           4         Charlotte     40     F     4          XML        30   G005     Y      3   Adhemar    10   Prof. dr.
           5           Vital       56    M      3           AI        60   G005     Y      1   Barabas    65   Prof. dr.

          {2,                                  {2,
               3,4                                  4}
                   }
                                                                     of the
                                  2/4 =        50% courses
                 of the
3/5 =   60% students
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page
PhD Defense of Wim Le Page

More Related Content

Similar to PhD Defense of Wim Le Page

Big data meets big analytics
Big data meets big analyticsBig data meets big analytics
Big data meets big analyticsDeepak Ramanathan
 
Asian Bankers Association, Manila Conference
Asian Bankers Association, Manila ConferenceAsian Bankers Association, Manila Conference
Asian Bankers Association, Manila ConferenceDeepak Ramanathan
 
Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011
Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011
Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011SEO CAMP
 
Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase
Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase
Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase Sybase Türkiye
 
Big Data Analytics in a Heterogeneous World - Joydeep Das of Sybase
Big Data Analytics in a Heterogeneous World - Joydeep Das of SybaseBig Data Analytics in a Heterogeneous World - Joydeep Das of Sybase
Big Data Analytics in a Heterogeneous World - Joydeep Das of SybaseBigDataCloud
 
Data mining process powerpoint presentation templates.
Data mining process powerpoint presentation templates.Data mining process powerpoint presentation templates.
Data mining process powerpoint presentation templates.SlideTeam.net
 
Data mining strategy powerpoint ppt templates.
Data mining strategy powerpoint ppt templates.Data mining strategy powerpoint ppt templates.
Data mining strategy powerpoint ppt templates.SlideTeam.net
 
Data mining process powerpoint ppt templates.
Data mining process powerpoint ppt templates.Data mining process powerpoint ppt templates.
Data mining process powerpoint ppt templates.SlideTeam.net
 
Data mining strategy powerpoint presentation templates.
Data mining strategy powerpoint presentation templates.Data mining strategy powerpoint presentation templates.
Data mining strategy powerpoint presentation templates.SlideTeam.net
 
Data mining process powerpoint presentation slides.
Data mining process powerpoint presentation slides.Data mining process powerpoint presentation slides.
Data mining process powerpoint presentation slides.SlideTeam.net
 
Data mining strategy powerpoint ppt slides.
Data mining strategy powerpoint ppt slides.Data mining strategy powerpoint ppt slides.
Data mining strategy powerpoint ppt slides.SlideTeam.net
 
Data mining & Decison Trees
Data mining & Decison TreesData mining & Decison Trees
Data mining & Decison TreesSelman Bozkır
 
Streaming Hadoop for Enterprise Adoption
Streaming Hadoop for Enterprise AdoptionStreaming Hadoop for Enterprise Adoption
Streaming Hadoop for Enterprise AdoptionDATAVERSITY
 

Similar to PhD Defense of Wim Le Page (16)

Data mining
Data miningData mining
Data mining
 
Big data meets big analytics
Big data meets big analyticsBig data meets big analytics
Big data meets big analytics
 
Asian Bankers Association, Manila Conference
Asian Bankers Association, Manila ConferenceAsian Bankers Association, Manila Conference
Asian Bankers Association, Manila Conference
 
Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011
Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011
Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011
 
Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase
Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase
Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase
 
Big Data Analytics in a Heterogeneous World - Joydeep Das of Sybase
Big Data Analytics in a Heterogeneous World - Joydeep Das of SybaseBig Data Analytics in a Heterogeneous World - Joydeep Das of Sybase
Big Data Analytics in a Heterogeneous World - Joydeep Das of Sybase
 
Data mining process powerpoint presentation templates.
Data mining process powerpoint presentation templates.Data mining process powerpoint presentation templates.
Data mining process powerpoint presentation templates.
 
Data mining strategy powerpoint ppt templates.
Data mining strategy powerpoint ppt templates.Data mining strategy powerpoint ppt templates.
Data mining strategy powerpoint ppt templates.
 
Data mining process powerpoint ppt templates.
Data mining process powerpoint ppt templates.Data mining process powerpoint ppt templates.
Data mining process powerpoint ppt templates.
 
Data mining strategy powerpoint presentation templates.
Data mining strategy powerpoint presentation templates.Data mining strategy powerpoint presentation templates.
Data mining strategy powerpoint presentation templates.
 
Data mining process powerpoint presentation slides.
Data mining process powerpoint presentation slides.Data mining process powerpoint presentation slides.
Data mining process powerpoint presentation slides.
 
Data mining strategy powerpoint ppt slides.
Data mining strategy powerpoint ppt slides.Data mining strategy powerpoint ppt slides.
Data mining strategy powerpoint ppt slides.
 
Graph
GraphGraph
Graph
 
Data mining & Decison Trees
Data mining & Decison TreesData mining & Decison Trees
Data mining & Decison Trees
 
Streaming Hadoop for Enterprise Adoption
Streaming Hadoop for Enterprise AdoptionStreaming Hadoop for Enterprise Adoption
Streaming Hadoop for Enterprise Adoption
 
Data warehousing
Data warehousingData warehousing
Data warehousing
 

Recently uploaded

Modern Roaming for Notes and Nomad – Cheaper Faster Better Stronger
Modern Roaming for Notes and Nomad – Cheaper Faster Better StrongerModern Roaming for Notes and Nomad – Cheaper Faster Better Stronger
Modern Roaming for Notes and Nomad – Cheaper Faster Better Strongerpanagenda
 
Enhancing User Experience - Exploring the Latest Features of Tallyman Axis Lo...
Enhancing User Experience - Exploring the Latest Features of Tallyman Axis Lo...Enhancing User Experience - Exploring the Latest Features of Tallyman Axis Lo...
Enhancing User Experience - Exploring the Latest Features of Tallyman Axis Lo...Scott Andery
 
Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024
Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024
Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024BookNet Canada
 
A Journey Into the Emotions of Software Developers
A Journey Into the Emotions of Software DevelopersA Journey Into the Emotions of Software Developers
A Journey Into the Emotions of Software DevelopersNicole Novielli
 
UiPath Community: Communication Mining from Zero to Hero
UiPath Community: Communication Mining from Zero to HeroUiPath Community: Communication Mining from Zero to Hero
UiPath Community: Communication Mining from Zero to HeroUiPathCommunity
 
Generative AI for Technical Writer or Information Developers
Generative AI for Technical Writer or Information DevelopersGenerative AI for Technical Writer or Information Developers
Generative AI for Technical Writer or Information DevelopersRaghuram Pandurangan
 
The State of Passkeys with FIDO Alliance.pptx
The State of Passkeys with FIDO Alliance.pptxThe State of Passkeys with FIDO Alliance.pptx
The State of Passkeys with FIDO Alliance.pptxLoriGlavin3
 
Decarbonising Buildings: Making a net-zero built environment a reality
Decarbonising Buildings: Making a net-zero built environment a realityDecarbonising Buildings: Making a net-zero built environment a reality
Decarbonising Buildings: Making a net-zero built environment a realityIES VE
 
What is DBT - The Ultimate Data Build Tool.pdf
What is DBT - The Ultimate Data Build Tool.pdfWhat is DBT - The Ultimate Data Build Tool.pdf
What is DBT - The Ultimate Data Build Tool.pdfMounikaPolabathina
 
Connecting the Dots for Information Discovery.pdf
Connecting the Dots for Information Discovery.pdfConnecting the Dots for Information Discovery.pdf
Connecting the Dots for Information Discovery.pdfNeo4j
 
Potential of AI (Generative AI) in Business: Learnings and Insights
Potential of AI (Generative AI) in Business: Learnings and InsightsPotential of AI (Generative AI) in Business: Learnings and Insights
Potential of AI (Generative AI) in Business: Learnings and InsightsRavi Sanghani
 
Arizona Broadband Policy Past, Present, and Future Presentation 3/25/24
Arizona Broadband Policy Past, Present, and Future Presentation 3/25/24Arizona Broadband Policy Past, Present, and Future Presentation 3/25/24
Arizona Broadband Policy Past, Present, and Future Presentation 3/25/24Mark Goldstein
 
Moving Beyond Passwords: FIDO Paris Seminar.pdf
Moving Beyond Passwords: FIDO Paris Seminar.pdfMoving Beyond Passwords: FIDO Paris Seminar.pdf
Moving Beyond Passwords: FIDO Paris Seminar.pdfLoriGlavin3
 
Emixa Mendix Meetup 11 April 2024 about Mendix Native development
Emixa Mendix Meetup 11 April 2024 about Mendix Native developmentEmixa Mendix Meetup 11 April 2024 about Mendix Native development
Emixa Mendix Meetup 11 April 2024 about Mendix Native developmentPim van der Noll
 
Why device, WIFI, and ISP insights are crucial to supporting remote Microsoft...
Why device, WIFI, and ISP insights are crucial to supporting remote Microsoft...Why device, WIFI, and ISP insights are crucial to supporting remote Microsoft...
Why device, WIFI, and ISP insights are crucial to supporting remote Microsoft...panagenda
 
A Deep Dive on Passkeys: FIDO Paris Seminar.pptx
A Deep Dive on Passkeys: FIDO Paris Seminar.pptxA Deep Dive on Passkeys: FIDO Paris Seminar.pptx
A Deep Dive on Passkeys: FIDO Paris Seminar.pptxLoriGlavin3
 
The Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptx
The Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptxThe Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptx
The Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptxLoriGlavin3
 
Assure Ecommerce and Retail Operations Uptime with ThousandEyes
Assure Ecommerce and Retail Operations Uptime with ThousandEyesAssure Ecommerce and Retail Operations Uptime with ThousandEyes
Assure Ecommerce and Retail Operations Uptime with ThousandEyesThousandEyes
 
How to write a Business Continuity Plan
How to write a Business Continuity PlanHow to write a Business Continuity Plan
How to write a Business Continuity PlanDatabarracks
 
Digital Identity is Under Attack: FIDO Paris Seminar.pptx
Digital Identity is Under Attack: FIDO Paris Seminar.pptxDigital Identity is Under Attack: FIDO Paris Seminar.pptx
Digital Identity is Under Attack: FIDO Paris Seminar.pptxLoriGlavin3
 

Recently uploaded (20)

Modern Roaming for Notes and Nomad – Cheaper Faster Better Stronger
Modern Roaming for Notes and Nomad – Cheaper Faster Better StrongerModern Roaming for Notes and Nomad – Cheaper Faster Better Stronger
Modern Roaming for Notes and Nomad – Cheaper Faster Better Stronger
 
Enhancing User Experience - Exploring the Latest Features of Tallyman Axis Lo...
Enhancing User Experience - Exploring the Latest Features of Tallyman Axis Lo...Enhancing User Experience - Exploring the Latest Features of Tallyman Axis Lo...
Enhancing User Experience - Exploring the Latest Features of Tallyman Axis Lo...
 
Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024
Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024
Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024
 
A Journey Into the Emotions of Software Developers
A Journey Into the Emotions of Software DevelopersA Journey Into the Emotions of Software Developers
A Journey Into the Emotions of Software Developers
 
UiPath Community: Communication Mining from Zero to Hero
UiPath Community: Communication Mining from Zero to HeroUiPath Community: Communication Mining from Zero to Hero
UiPath Community: Communication Mining from Zero to Hero
 
Generative AI for Technical Writer or Information Developers
Generative AI for Technical Writer or Information DevelopersGenerative AI for Technical Writer or Information Developers
Generative AI for Technical Writer or Information Developers
 
The State of Passkeys with FIDO Alliance.pptx
The State of Passkeys with FIDO Alliance.pptxThe State of Passkeys with FIDO Alliance.pptx
The State of Passkeys with FIDO Alliance.pptx
 
Decarbonising Buildings: Making a net-zero built environment a reality
Decarbonising Buildings: Making a net-zero built environment a realityDecarbonising Buildings: Making a net-zero built environment a reality
Decarbonising Buildings: Making a net-zero built environment a reality
 
What is DBT - The Ultimate Data Build Tool.pdf
What is DBT - The Ultimate Data Build Tool.pdfWhat is DBT - The Ultimate Data Build Tool.pdf
What is DBT - The Ultimate Data Build Tool.pdf
 
Connecting the Dots for Information Discovery.pdf
Connecting the Dots for Information Discovery.pdfConnecting the Dots for Information Discovery.pdf
Connecting the Dots for Information Discovery.pdf
 
Potential of AI (Generative AI) in Business: Learnings and Insights
Potential of AI (Generative AI) in Business: Learnings and InsightsPotential of AI (Generative AI) in Business: Learnings and Insights
Potential of AI (Generative AI) in Business: Learnings and Insights
 
Arizona Broadband Policy Past, Present, and Future Presentation 3/25/24
Arizona Broadband Policy Past, Present, and Future Presentation 3/25/24Arizona Broadband Policy Past, Present, and Future Presentation 3/25/24
Arizona Broadband Policy Past, Present, and Future Presentation 3/25/24
 
Moving Beyond Passwords: FIDO Paris Seminar.pdf
Moving Beyond Passwords: FIDO Paris Seminar.pdfMoving Beyond Passwords: FIDO Paris Seminar.pdf
Moving Beyond Passwords: FIDO Paris Seminar.pdf
 
Emixa Mendix Meetup 11 April 2024 about Mendix Native development
Emixa Mendix Meetup 11 April 2024 about Mendix Native developmentEmixa Mendix Meetup 11 April 2024 about Mendix Native development
Emixa Mendix Meetup 11 April 2024 about Mendix Native development
 
Why device, WIFI, and ISP insights are crucial to supporting remote Microsoft...
Why device, WIFI, and ISP insights are crucial to supporting remote Microsoft...Why device, WIFI, and ISP insights are crucial to supporting remote Microsoft...
Why device, WIFI, and ISP insights are crucial to supporting remote Microsoft...
 
A Deep Dive on Passkeys: FIDO Paris Seminar.pptx
A Deep Dive on Passkeys: FIDO Paris Seminar.pptxA Deep Dive on Passkeys: FIDO Paris Seminar.pptx
A Deep Dive on Passkeys: FIDO Paris Seminar.pptx
 
The Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptx
The Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptxThe Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptx
The Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptx
 
Assure Ecommerce and Retail Operations Uptime with ThousandEyes
Assure Ecommerce and Retail Operations Uptime with ThousandEyesAssure Ecommerce and Retail Operations Uptime with ThousandEyes
Assure Ecommerce and Retail Operations Uptime with ThousandEyes
 
How to write a Business Continuity Plan
How to write a Business Continuity PlanHow to write a Business Continuity Plan
How to write a Business Continuity Plan
 
Digital Identity is Under Attack: FIDO Paris Seminar.pptx
Digital Identity is Under Attack: FIDO Paris Seminar.pptxDigital Identity is Under Attack: FIDO Paris Seminar.pptx
Digital Identity is Under Attack: FIDO Paris Seminar.pptx
 

PhD Defense of Wim Le Page

  • 1. Mining Patterns in Relational Databases Wim Le Page 16 december 2009
  • 5. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 6. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 7. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 8. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 9. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 10. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 11. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 12. market basket analysis
  • 13. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 14. shop selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 15. shop selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 16. shop selection, transformation database frequent itemset mining data evaluation, presentation patterns knowledge
  • 17. shop selection, transformation database frequent itemset mining data evaluation, presentation patterns knowledge
  • 18. shop selection, transformation database frequent itemset mining data evaluation, presentation patterns 75% knowledge
  • 19.
  • 21. 1000 products 21000 possible itemsets
  • 22. 1000 products 21000 possible itemsets ≈10 301
  • 23. 1000 products 21000 possible itemsets ≈10 301 =1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
  • 24.
  • 27.
  • 28.
  • 29. Professor ID Name Age Title 1 Barabas 65 Prof. dr. 2 Gobelijn 65 Prof. dr. 3 Adhemar 10 Prof. dr.
  • 30. Course Professor ID Name SP Room Project ID Name Age Title 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 4 XML 30 G005 Y
  • 31. Course Professor ID Name SP Room Project ID Name Age Title 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 4 XML 30 G005 Y Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M
  • 32. Database Course Professor ID Name SP Room Project ID Name Age Title 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 4 XML 30 G005 Y Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M
  • 33. Database Course Professor ID Name SP Room Project ID Name Age Title 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 4 XML 30 G005 Y Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M
  • 34. Database Teaches Course Professor Prof.ID Course.ID ID Name SP Room Project ID Name Age Title 1 2 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 1 3 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 2 1 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 2 4 4 XML 30 G005 Y 3 4 Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M
  • 35. Database Teaches Course Professor Prof.ID Course.ID ID Name SP Room Project ID Name Age Title 1 2 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 1 3 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 2 1 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 2 4 4 XML 30 G005 Y 3 4 Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M
  • 36. Database Teaches Course Professor Prof.ID Course.ID ID Name SP Room Project ID Name Age Title 1 2 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 1 3 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 2 1 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 2 4 4 XML 30 G005 Y 3 4 Takes Student.ID Course.ID 1 1 1 3 2 2 2 4 Student 3 1 ID Name Age Sex 3 2 1 Marcel 40 M 3 3 2 Fanny 19 F 3 4 3 Konstantinopel 12 M 4 1 4 Charlotte 40 F 5 3 5 Vital 56 M
  • 37. Relational Database Teaches Course Professor Prof.ID Course.ID ID Name SP Room Project ID Name Age Title 1 2 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 1 3 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 2 1 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 2 4 4 XML 30 G005 Y 3 4 Takes Student.ID Course.ID 1 1 1 3 2 2 2 4 Student 3 1 ID Name Age Sex 3 2 1 Marcel 40 M 3 3 2 Fanny 19 F 3 4 3 Konstantinopel 12 M 4 1 4 Charlotte 40 F 5 3 5 Vital 56 M
  • 38. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 39. selection, transformation database data mining data evaluation, presentation patterns knowledge
  • 40. selection, transformation relational database data mining data evaluation, presentation patterns knowledge
  • 41. selection, transformation relational database data mining data evaluation, presentation patterns knowledge
  • 42. data mining data patterns
  • 43. relational data mining data patterns
  • 44. relational data mining relational relational data patterns
  • 45.
  • 50. Queries Which students are male? Which professors teach a course in room G010?
  • 51. Queries Which students are male? Which professors teach a course in room G010? Which courses have a project and are taken by female students?
  • 52. Queries Which courses have a project and are taken by female students?
  • 53. Queries Which courses have a project and are taken by female students?
  • 54. Queries Which courses have a project and are taken by female students? SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID
  • 55. Queries Which courses have a project and are taken by female students? SELECT DISTINCT Course.ID FROM Course, Takes, Student ID Name SP Room Project WHERE Course.project = ‘Y’ 1 Databases 60 G010 Y AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID 4 XML 30 G005 Y AND Course.ID = Takes.CourseID
  • 56. Queries SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID
  • 57. Queries General SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID
  • 58. Queries General Efficient SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID
  • 59. Queries General Efficient SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID Natural
  • 60. Queries General Efficient SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID Natural Flexible
  • 62. Queries Which students are male? Which professors teach a course in room G010? Which courses have a project and are taken by female students?
  • 63. Queries ID Name Age Sex Which students are male? 1 3 Marcel Konstantinopel 40 12 M M 5 Vital 56 M ID Name Age Title Which professors teach a course in room G010? 2 Gobelijn 65 Prof. dr. Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y
  • 64. Queries ID Name Age Sex Which students are male? 1 3 Marcel Konstantinopel 40 12 M M 5 Vital 56 M ID Name Age Title Which professors teach a course in room G010? 2 Gobelijn 65 Prof. dr. Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y
  • 65. Frequent Queries ID Name Age Sex Which students are male? 1 3 Marcel Konstantinopel 40 12 M M 5 Vital 56 M ID Name Age Title Which professors teach a course in room G010? 2 Gobelijn 65 Prof. dr. Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y
  • 66. Frequent Queries Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y
  • 67. Frequent Queries ID Name SP Room Project Which courses have a project? 1 3 4 Databases AI XML 60 60 30 G010 G005 G005 Y Y Y Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y
  • 68. Frequent Queries ID Name SP Room Project Which courses have a project? 1 3 4 Databases AI XML 60 60 30 G010 G005 G005 Y Y Y Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y
  • 69. Frequent Queries 66% of courses with a project are taken by female students ID Name SP Room Project Which courses have a project? 1 3 4 Databases AI XML 60 60 30 G010 G005 G005 Y Y Y Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y
  • 70. Contained Frequent Queries 66% of courses with a project are taken by female students ID Name SP Room Project Which courses have a project? 1 3 4 Databases AI XML 60 60 30 G010 G005 G005 Y Y Y Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y
  • 71. pairs of contained frequent queries
  • 72. relational data mining relational pairs of contained data frequent queries
  • 73. Conqueror Algorithm relational pairs of contained data frequent queries
  • 75. Conqueror Algorithm Generate queries
  • 76. Conqueror Algorithm Generate queries Evaluate queries
  • 77. Conqueror Algorithm Generate queries Evaluate queries Pair queries
  • 78. Conqueror Algorithm Generate queries
  • 79. Conqueror Algorithm Generate queries Simple Conjunctive Queries
  • 80. Conqueror Algorithm Generate queries Simple Conjunctive Queries A=B
  • 81. Conqueror Algorithm Generate queries Simple Conjunctive Queries A=B A>B
  • 82. Conqueror Algorithm Generate queries Simple Conjunctive Queries A=B R×1 A>B
  • 83. Conqueror Algorithm Generate queries Simple Conjunctive Queries A=B R×1 A>B R,R
  • 84. Conqueror Algorithm Generate queries
  • 85. Conqueror Algorithm Generate queries SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID
  • 86. Conqueror Algorithm Generate queries ⋈ Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID
  • 87. Conqueror Algorithm Generate queries ⋈ Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID π SELECT DISTINCT Course.ID SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID
  • 88. Conqueror Algorithm Generate queries ⋈ Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID π SELECT DISTINCT Course.ID σ Course.project = ‘Y’ AND Student.sex = ‘F’ SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID
  • 89. Conqueror Algorithm Generate queries Evaluate queries Pair queries
  • 90. Conqueror Algorithm Generate queries Evaluate queries Pair queries
  • 91. Conqueror Algorithm Generate queries Evaluate queries Pair queries
  • 92. Conqueror Algorithm Generate queries Evaluate queries Pair queries
  • 93. Conqueror Algorithm Generate queries Evaluate queries Pair queries
  • 94. Conqueror Algorithm Generate queries Evaluate queries Pair queries
  • 95.
  • 96.
  • 97.
  • 98.
  • 99. The number of players that play a quiz they made themselves?
  • 100. The number of players that play a quiz they made themselves and got the maximum score? The number of players that play a quiz they made themselves?
  • 101. The number of players that play a quiz they made themselves and got the maximum score? ≠ The number of players that play a quiz they made themselves?
  • 102. The number of players that play a quiz they made themselves and got the maximum score? = 86% of The number of players that play a quiz they made themselves?
  • 103. The number of players that play a quiz they made themselves and got the maximum score? = 86% of The number of players that play a quiz they made themselves? 14% of the players do not maximal get a score on a quiz they made themselves
  • 104.
  • 105. The number of quizzes that are played?
  • 106. The number of quizzes that are played in 2006? The number of quizzes that are played?
  • 107. The number of quizzes that are played in 2006? = 91% of The number of quizzes that are played?
  • 108. The number of quizzes that are played in 2006? = 91% of The number of quizzes that are played? majorityof the quizzes were played in 2006
  • 109.
  • 110. The number of players?
  • 111. The number of players that play a quiz that exists? The number of players?
  • 112. The number of players that play a quiz that exists? ≠ The number of players?
  • 113. The number of players that play a quiz that exists? = 99% of The number of players?
  • 114. The number of players that play a quiz that exists? = 99% of The number of players? 1% of the players play a quiz that does notexist
  • 123. Itemsets Market Baskets ID Bread Butter Cheese Wine 1 Y Y N N 2 Y N Y N 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y
  • 124. Itemsets Market Baskets ID 1 Bread Y Butter Y Cheese N Wine N frequent 2 Y N Y N itemset mining 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y
  • 125. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset mining 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y
  • 126. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} mining 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y
  • 127. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y
  • 128. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y
  • 129. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y
  • 130. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y
  • 131. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y
  • 132. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12}
  • 133. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50%
  • 134. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50%
  • 135. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50%
  • 136. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50%
  • 137. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50% {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75%
  • 138. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50% {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75% {(Wine=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/6 = 100%
  • 139. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50% {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75% {(Wine=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/6 = 100% association rules
  • 141. Itemsets Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M
  • 142. Itemsets Course ID Name SP Room Project 1 Databases 60 G010 Y Student 2 Data Mining 30 G005 N 3 AI 60 G005 Y ID Name Age Sex 4 XML 30 G005 Y 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M Professor 4 Charlotte 40 F ID Name Age Title 5 Vital 56 M 1 Barabas 65 Prof. dr. 2 Gobelijn 65 Prof. dr. 3 Adhemar 10 Prof. dr.
  • 143. Itemsets Course Takes ID Name SP Room Project Student.ID Course.ID 1 Databases 60 G010 Y Student Teaches 1 1 2 Data Mining 30 G005 N ID Name Age Sex Prof.ID Course.ID 1 3 3 AI 60 G005 Y 4 XML 30 G005 Y 1 Marcel 40 M 1 2 2 2 2 Fanny 19 F 1 3 2 4 3 Konstantinopel 12 M 2 1 3 1 Professor 4 Charlotte 40 F 2 4 3 2 ID Name Age Title 5 Vital 56 M 3 4 3 3 1 Barabas 65 Prof. dr. 3 4 2 Gobelijn 65 Prof. dr. 4 1 3 Adhemar 10 Prof. dr. 5 3
  • 144. Itemsets Course Takes ID Name SP Room Project Student.ID Course.ID 1 Databases 60 G010 Y Student Teaches 1 1 2 Data Mining 30 G005 N ID Name Age Sex Prof.ID Course.ID 1 3 3 AI 60 G005 Y 4 XML 30 G005 Y 1 Marcel 40 M 1 2 2 2 2 Fanny 19 F 1 3 2 4 3 Konstantinopel 12 M 2 1 3 1 Professor 4 Charlotte 40 F 2 4 3 2 ID Name Age Title 5 Vital 56 M 3 4 3 3 1 Barabas 65 Prof. dr. 3 4 2 Gobelijn 65 Prof. dr. 4 1 3 Adhemar 10 Prof. dr. 5 3
  • 145. Itemsets Course Takes ID Name SP Room Project Student.ID Course.ID 1 Databases 60 G010 Y Student Teaches 1 1 2 Data Mining 30 G005 N ID Name Age Sex Prof.ID Course.ID 1 3 3 AI 60 G005 Y 4 XML 30 G005 Y 1 Marcel 40 M 1 2 2 2 2 Fanny 19 F 1 3 2 4 3 Konstantinopel 12 M 2 1 3 1 Professor 4 Charlotte 40 F 2 4 3 2 ID Name Age Title 5 Vital 56 M 3 4 3 3 1 Barabas 65 Prof. dr. 3 4 2 Gobelijn 65 Prof. dr. 4 1 3 Adhemar 10 Prof. dr. 5 3
  • 146. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
  • 147. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
  • 148. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. frequent itemset mining
  • 149. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. frequent itemset mining {(project=Y)} 12/14 = 86%
  • 150. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. frequent itemset mining {(project=Y)} 12/14 = 86% of ?
  • 151. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. ✘ frequency has no clear meaning
  • 154. The Key Idea Student Professor ID Name Age Sex ID Name Age Title 1 Marcel 40 M 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 5 Vital 56 M Course ID Name SP Room Project 1 Databases 60 G010 Y 2 Data Mining 30 G005 N 3 AI 60 G005 Y 4 XML 30 G005 Y
  • 155. The Key Idea Student Professor ID Name Age Sex ID Name Age Title 1 Marcel 40 M 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 5 Vital 56 M Course ID Name SP Room Project 1 Databases 60 G010 Y 2 Data Mining 30 G005 N 3 AI 60 G005 Y 4 XML 30 G005 Y
  • 156. The Key Idea Student Professor ID Name Age Sex ID Name Age Title 1 Marcel 40 M 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 5 Vital 56 M Course ID Name SP Room Project 1 Databases 60 G010 Y 2 Data Mining 30 G005 N 3 AI 60 G005 Y 4 XML 30 G005 Y
  • 157. The Key Idea Student Professor ID Name Age Sex ID Name Age Title 1 Marcel 40 M 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 5 Vital 56 M Course ID Name SP Room Project 1 Databases 60 G010 Y 2 Data Mining 30 G005 N 3 AI 60 G005 Y 4 XML 30 G005 Y
  • 158. The Key Idea S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
  • 159. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
  • 160. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
  • 161. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, 4}
  • 162. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, 4} of the 2/4 = 50% courses
  • 163. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, 4} of the 2/4 = 50% courses
  • 164. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, 4} of the 2/4 = 50% courses
  • 165. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, {2, 3,4 4} } of the 2/4 = 50% courses
  • 166. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, {2, 3,4 4} } of the 2/4 = 50% courses of the 3/5 = 60% students
  • 167. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, {2, 3,4 4} } of the 2/4 = 50% courses of the 3/5 = 60% students

Editor's Notes

  1. Goedenavond beste leden van de jury, collega's, vrienden, familie. Vandaag verdedig ik mijn proefschrift getiteld Mining Patterns in Relational Databases
  2. Een eerste vraag die dan misschien bij jullie opkomt is, wat is dat, dat Mining. Wel, de meeste mensen weten wel wat gewone mijnbouw inhoud. Bij mijnbouw gaan we op een systematisch manier in de bodem of gesteente op zoek naar waardevolle materialen zoals erts, goud, mineralen of brandstoffen. De term data mining is dan ook gekozen naar analogie met dit proces.
  3. Naar analogie met de bodem of gesteente beschouwen we als startpunt van ons mijnproces data. Data dat net zoals gesteente in grote hoeveelheden in de huidige wereld aanwezig is. We leven momenteel in een kennismaatschappij, en dankzij internet en een veelvoud aan digitale toestellen beschikken we over enorme hoeveelheden van data.
  4. In deze grote hoeveelheden data, zit zoals in de rotsen bij industriële mijnbouw, iets waardevols verborgen. Dit waardevols is kennis. Nieuwe patronen waarvan we voorheen niet wisten dat ze golden. Maar net zoals bij industriele mijnbouw, is de hoeveelheid aan data te groot om manueel op zoek te gaan naar zulke patronen. We moeten het ook hier systematisch aanpakken.
  5. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  6. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  7. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  8. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  9. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  10. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  11. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  12. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  13. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  14. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  15. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  16. Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
  17. Ik zal dit proces even verduidelijken aan de hand van een voorbeeld. Een van eerste toepassingen van data mining was het analyseren van supermarktdatabases. Hierbij analyseren we de winkelkarretjes, oftewel, de verzamelingen van producten die klanten kopen.
  18. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  19. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  20. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  21. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  22. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  23. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  24. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  25. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  26. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  27. Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo’n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
  28. Dit lijkt eenvoudig. Maar neem even aan dat de supermarkt slechts 1000 producten verkoopt. De hoeveelheid mogelijke verzamelingen van producten is dan gelijk aan 2 tot de 1000ste. Dit is ongeveer gelijk aan 10 tot de 301ste oftwel een 1 met 301 nullen. Dit is een gigantische hoeveelheid. Meer zelfs
  29. Dit lijkt eenvoudig. Maar neem even aan dat de supermarkt slechts 1000 producten verkoopt. De hoeveelheid mogelijke verzamelingen van producten is dan gelijk aan 2 tot de 1000ste. Dit is ongeveer gelijk aan 10 tot de 301ste oftwel een 1 met 301 nullen. Dit is een gigantische hoeveelheid. Meer zelfs
  30. Dit lijkt eenvoudig. Maar neem even aan dat de supermarkt slechts 1000 producten verkoopt. De hoeveelheid mogelijke verzamelingen van producten is dan gelijk aan 2 tot de 1000ste. Dit is ongeveer gelijk aan 10 tot de 301ste oftwel een 1 met 301 nullen. Dit is een gigantische hoeveelheid. Meer zelfs
  31. Dit lijkt eenvoudig. Maar neem even aan dat de supermarkt slechts 1000 producten verkoopt. De hoeveelheid mogelijke verzamelingen van producten is dan gelijk aan 2 tot de 1000ste. Dit is ongeveer gelijk aan 10 tot de 301ste oftwel een 1 met 301 nullen. Dit is een gigantische hoeveelheid. Meer zelfs
  32. dit getal is groter dan het aantal atomen in het observeerbare universum. Immens veel dus. Het is dan ook onmogelijk om al deze verzamelingen even allemaal op te sommen en te controleren of ze vaak voorkomen.
  33. We hebben dus een nood aan efficiente data mining algoritmes die wel in staat zijn om efficient de frequente of in het algemeen interessante patronen te vinden.
  34. Dat was een korte samenvatting van wat data mining is. Maar mijn proefschrift behandeld het ontdekken van patronen in relationele databases. Wat is nu precies een relationele database? Laat ik dit ook illustreren aan de hand van een voorbeeld.
  35. Aan deze universiteit geven professoren weel eens cursussen aan studenten. Deze informatie kunnen we ook opslaan in een relationele database.
  36. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  37. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  38. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  39. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  40. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  41. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  42. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  43. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  44. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  45. We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
  46. Terug naar het proces van kennis ontdekking dus, waar we dus nu relationele databases beschouwen als startpunt.
  47. Terug naar het proces van kennis ontdekking dus, waar we dus nu relationele databases beschouwen als startpunt.
  48. Terug naar het proces van kennis ontdekking dus, waar we dus nu relationele databases beschouwen als startpunt.
  49. We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
  50. We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
  51. We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
  52. We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
  53. We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
  54. Om zulke algoritmes te kunnen ontwikkelen moeten we eerst definieren wat wel als relationele patronen beschouwen. In mijn proefschrift beschouwen we twee types relationele patronen: queries en itemset
  55. Om zulke algoritmes te kunnen ontwikkelen moeten we eerst definieren wat wel als relationele patronen beschouwen. In mijn proefschrift beschouwen we twee types relationele patronen: queries en itemset
  56. Ik zal mij eerste toespitsen op het eerste type; queries. Wat zijn queries? Wel queries zijn niets anders dan vragen die je aan een database kan stellen. In het geval van de universteitsdatabase zou dit bvb kunnen zijn. Wie zijn de mannelijke studenten? OF Welke professoren geven een cursus in lokaal G010? OF Welke cursussen hebben een project en worden gevolgd door vrouwelijke studenten?
  57. Ik zal mij eerste toespitsen op het eerste type; queries. Wat zijn queries? Wel queries zijn niets anders dan vragen die je aan een database kan stellen. In het geval van de universteitsdatabase zou dit bvb kunnen zijn. Wie zijn de mannelijke studenten? OF Welke professoren geven een cursus in lokaal G010? OF Welke cursussen hebben een project en worden gevolgd door vrouwelijke studenten?
  58. Ik zal mij eerste toespitsen op het eerste type; queries. Wat zijn queries? Wel queries zijn niets anders dan vragen die je aan een database kan stellen. In het geval van de universteitsdatabase zou dit bvb kunnen zijn. Wie zijn de mannelijke studenten? OF Welke professoren geven een cursus in lokaal G010? OF Welke cursussen hebben een project en worden gevolgd door vrouwelijke studenten?
  59. Neem nu bijvoorbeeld deze laatste query. Gegeven de relationele universiteitsdatabase, kunnen we deze vraag stellen. Dit gebeurd in de SQL taal, die speciaal werd ontwikkeld om relationele databases te ondervragen. Het stellen van deze vraag zal dan een resultaat opleveren dat ook in een tabelletje kan worden weergegeven. Hier zien we dan de cursussen die een project hebben en gevolgd worden door vrouwelijke studenten.
  60. Neem nu bijvoorbeeld deze laatste query. Gegeven de relationele universiteitsdatabase, kunnen we deze vraag stellen. Dit gebeurd in de SQL taal, die speciaal werd ontwikkeld om relationele databases te ondervragen. Het stellen van deze vraag zal dan een resultaat opleveren dat ook in een tabelletje kan worden weergegeven. Hier zien we dan de cursussen die een project hebben en gevolgd worden door vrouwelijke studenten.
  61. Neem nu bijvoorbeeld deze laatste query. Gegeven de relationele universiteitsdatabase, kunnen we deze vraag stellen. Dit gebeurd in de SQL taal, die speciaal werd ontwikkeld om relationele databases te ondervragen. Het stellen van deze vraag zal dan een resultaat opleveren dat ook in een tabelletje kan worden weergegeven. Hier zien we dan de cursussen die een project hebben en gevolgd worden door vrouwelijke studenten.
  62. Neem nu bijvoorbeeld deze laatste query. Gegeven de relationele universiteitsdatabase, kunnen we deze vraag stellen. Dit gebeurd in de SQL taal, die speciaal werd ontwikkeld om relationele databases te ondervragen. Het stellen van deze vraag zal dan een resultaat opleveren dat ook in een tabelletje kan worden weergegeven. Hier zien we dan de cursussen die een project hebben en gevolgd worden door vrouwelijke studenten.
  63. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  64. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  65. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  66. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  67. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  68. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  69. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  70. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  71. Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
  72. We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
  73. We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
  74. We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
  75. We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
  76. We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
  77. We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
  78. We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
  79. Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
  80. Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
  81. Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
  82. Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
  83. Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
  84. Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
  85. Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
  86. Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
  87. Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
  88. Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
  89. Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
  90. Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
  91. Het Conqueror algoritme bestaat grofweg uit drie onderdelen. Het genereren van queries. Het evalueren van queries en het koppelen van queries.
  92. Het Conqueror algoritme bestaat grofweg uit drie onderdelen. Het genereren van queries. Het evalueren van queries en het koppelen van queries.
  93. Het Conqueror algoritme bestaat grofweg uit drie onderdelen. Het genereren van queries. Het evalueren van queries en het koppelen van queries.
  94. Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
  95. Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
  96. Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
  97. Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
  98. Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
  99. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  100. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  101. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  102. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  103. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  104. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  105. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  106. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  107. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  108. Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
  109. Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
  110. Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
  111. Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
  112. Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
  113. Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
  114. De database uit dit experiment is de database van een Quiz website. Bij zulke een quiz krijg je negen vragen. En op het einde krijg je dan een score op negen toegewezen.
  115. De database uit dit experiment is de database van een Quiz website. Bij zulke een quiz krijg je negen vragen. En op het einde krijg je dan een score op negen toegewezen.
  116. We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
  117. We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
  118. We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
  119. We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
  120. We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
  121. We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
  122. We vonden ook het volgende koppel frequente queries. Als we het totale aantal quizzen vergelijken met het aantal quizzen gespeeld in 2006, zien we dat die 91% is. Met andere woorden we vinden het patroon dat in 2006 de meerderheid van de quizzen gespeeld werd.
  123. We vonden ook het volgende koppel frequente queries. Als we het totale aantal quizzen vergelijken met het aantal quizzen gespeeld in 2006, zien we dat die 91% is. Met andere woorden we vinden het patroon dat in 2006 de meerderheid van de quizzen gespeeld werd.
  124. We vonden ook het volgende koppel frequente queries. Als we het totale aantal quizzen vergelijken met het aantal quizzen gespeeld in 2006, zien we dat die 91% is. Met andere woorden we vinden het patroon dat in 2006 de meerderheid van de quizzen gespeeld werd.
  125. We vonden ook het volgende koppel frequente queries. Als we het totale aantal quizzen vergelijken met het aantal quizzen gespeeld in 2006, zien we dat die 91% is. Met andere woorden we vinden het patroon dat in 2006 de meerderheid van de quizzen gespeeld werd.
  126. We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
  127. We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
  128. We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
  129. We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
  130. We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
  131. We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
  132. Goed, hiermee besluiten we queries als relationeel patroontype. Het tweede patroontype dat in mijn proefwerk wordt beschouwd zijn itemsets.
  133. Goed, hiermee besluiten we queries als relationeel patroontype. Het tweede patroontype dat in mijn proefwerk wordt beschouwd zijn itemsets.
  134. Goed, hiermee besluiten we queries als relationeel patroontype. Het tweede patroontype dat in mijn proefwerk wordt beschouwd zijn itemsets.
  135. We zagen itemsets al helemaal in het begin van deze presentatie, toen we het hadden over winkelkarretjes. Hierop voerden we frequent itemset mining uit om zo tot verzamelingen te komen van frequent samen gekochte producten. Laat ons nu even kijk hoe dat in zijn werk gaat.
  136. We zagen itemsets al helemaal in het begin van deze presentatie, toen we het hadden over winkelkarretjes. Hierop voerden we frequent itemset mining uit om zo tot verzamelingen te komen van frequent samen gekochte producten. Laat ons nu even kijk hoe dat in zijn werk gaat.
  137. We zagen itemsets al helemaal in het begin van deze presentatie, toen we het hadden over winkelkarretjes. Hierop voerden we frequent itemset mining uit om zo tot verzamelingen te komen van frequent samen gekochte producten. Laat ons nu even kijk hoe dat in zijn werk gaat.
  138. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  139. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  140. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  141. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  142. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  143. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  144. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  145. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  146. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  147. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  148. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  149. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  150. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  151. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  152. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  153. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  154. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  155. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  156. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  157. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  158. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  159. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  160. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  161. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  162. De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon “kaas komt voor in het karretje”, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen “wijn” komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
  163. Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
  164. Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
  165. Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
  166. Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
  167. Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
  168. Op die manier kunnen we van deze verschillende tabellen...
  169. Op die manier kunnen we van deze verschillende tabellen...
  170. Op die manier kunnen we van deze verschillende tabellen...
  171. Op die manier kunnen we van deze verschillende tabellen...
  172. ... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
  173. ... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
  174. ... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
  175. ... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
  176. ... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
  177. ... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
  178. ... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
  179. ... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
  180. Daarom kwamen we met het volgende sleutel of key idee.
  181. In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
  182. In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
  183. In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
  184. In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
  185. In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
  186. In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
  187. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  188. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  189. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  190. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  191. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  192. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  193. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  194. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  195. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  196. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  197. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  198. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  199. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  200. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  201. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  202. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  203. Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
  204. Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
  205. Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
  206. Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
  207. Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
  208. Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
  209. Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
  210. Er is echter nog een resterend probleem. De join tabel die we gebruiken om onze patronen in te vinden is typisch erg groot. Zo groot dat deze te veel geheugen van de computer vereist, maar evenzeer te veel tijd om ze op te stellen Er is dus nood aan een efficient algoritme op dit probleem aan te pakken.
  211. Er is echter nog een resterend probleem. De join tabel die we gebruiken om onze patronen in te vinden is typisch erg groot. Zo groot dat deze te veel geheugen van de computer vereist, maar evenzeer te veel tijd om ze op te stellen Er is dus nood aan een efficient algoritme op dit probleem aan te pakken.
  212. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  213. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  214. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  215. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  216. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  217. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  218. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  219. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  220. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  221. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  222. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  223. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  224. Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
  225. Ik ga het SMuRFIG algoritme niet in volle detail uitleggen maar enkel twee van de belangrijkste concepten die het gebruikt en dat is intersectie EN propagatie
  226. Ik ga het SMuRFIG algoritme niet in volle detail uitleggen maar enkel twee van de belangrijkste concepten die het gebruikt en dat is intersectie EN propagatie
  227. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  228. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  229. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  230. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  231. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  232. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  233. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  234. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  235. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  236. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  237. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  238. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  239. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  240. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  241. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  242. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  243. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  244. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  245. Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
  246. Dat was ruwweg gezegd intersectie, de eerste basiscomponent van he SMuRFIG algoritme. De tweede component is propagatie.
  247. Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
  248. Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
  249. Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
  250. Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
  251. Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
  252. Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
  253. Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
  254. Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
  255. en dan weer verder kunnen we met behulp van de relatie Takes deze cursussen propageren naar de studenten. Zo bekomen we dus dat studenten 1,2,3 en 5 gelinkt zijn aan professor barabas.
  256. en dan weer verder kunnen we met behulp van de relatie Takes deze cursussen propageren naar de studenten. Zo bekomen we dus dat studenten 1,2,3 en 5 gelinkt zijn aan professor barabas.
  257. en dan weer verder kunnen we met behulp van de relatie Takes deze cursussen propageren naar de studenten. Zo bekomen we dus dat studenten 1,2,3 en 5 gelinkt zijn aan professor barabas.
  258. Dat is ruwweg genomen propagatie. Nu in ons voorbeeld defineerden we intersectie nog aan de hand van de join tabel, maar doordat propagatie zullen we deze echter niet berekenen. In het SMuRFIG algoritme ontwikkelde we echter een nieuwe manier om intersectie en propagatie te combineren om zo relationele itemsets te genereren. Op deze complexe integratie ga ik echter niet verder in, maar beschouw ik kort nog een experimenteel voorbeeld.
  259. In de database van het departement wiskunde en informatica vonden we zo bijvoorbeeld het frequente patroon studenten in bachelor informatica. Door te kijken naar de verschillende sleutels vinden we zo dat 75 % vd studenten BINF stud zijn 68% van de profs een cursus geven aan BINF stud EN slecht 39% vd cursussen worden gevolgd door BINF studs.
  260. In de database van het departement wiskunde en informatica vonden we zo bijvoorbeeld het frequente patroon studenten in bachelor informatica. Door te kijken naar de verschillende sleutels vinden we zo dat 75 % vd studenten BINF stud zijn 68% van de profs een cursus geven aan BINF stud EN slecht 39% vd cursussen worden gevolgd door BINF studs.
  261. In de database van het departement wiskunde en informatica vonden we zo bijvoorbeeld het frequente patroon studenten in bachelor informatica. Door te kijken naar de verschillende sleutels vinden we zo dat 75 % vd studenten BINF stud zijn 68% van de profs een cursus geven aan BINF stud EN slecht 39% vd cursussen worden gevolgd door BINF studs.
  262. In de database van het departement wiskunde en informatica vonden we zo bijvoorbeeld het frequente patroon studenten in bachelor informatica. Door te kijken naar de verschillende sleutels vinden we zo dat 75 % vd studenten BINF stud zijn 68% van de profs een cursus geven aan BINF stud EN slecht 39% vd cursussen worden gevolgd door BINF studs.
  263. Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
  264. Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
  265. Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
  266. Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
  267. Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
  268. Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
  269. en dat is de patroon explosie. Een grote database levert een groot aantal patronen op. En we willen deze verzameling patronen natuurlijk enkel beperken tot diegene die we echt interessant vinden.
  270. en dat is de patroon explosie. Een grote database levert een groot aantal patronen op. En we willen deze verzameling patronen natuurlijk enkel beperken tot diegene die we echt interessant vinden.
  271. Zowel voor het Conqueror algoritme als voor het SMuRFIG algoritme bekeken we in ons proefschrift enkele oplossingen voor die ik slechts kort zal opsommen. Voor Conqueror keken we naar het detecteren van afhankelijkheden in de data. Afhankelijkheden in de data kunnen namelijk veel redundante patronen opleveren. Door deze echter eerst te ontdekken kunnen we vele redundanties vermijden. Ook bij het SMuRFIG algoritme keken we naar het elimineren van redundantie en veralgemeenden we enkele technieken uit standaard frequent itemset mining naar onze relationele itemsets. Hier bovenop definieerden we ook een nieuwe maat, deviation genaamd, die ons toelaat om meer focus te leggen op het ontdekken van onverwachte patronen.
  272. Zowel voor het Conqueror algoritme als voor het SMuRFIG algoritme bekeken we in ons proefschrift enkele oplossingen voor die ik slechts kort zal opsommen. Voor Conqueror keken we naar het detecteren van afhankelijkheden in de data. Afhankelijkheden in de data kunnen namelijk veel redundante patronen opleveren. Door deze echter eerst te ontdekken kunnen we vele redundanties vermijden. Ook bij het SMuRFIG algoritme keken we naar het elimineren van redundantie en veralgemeenden we enkele technieken uit standaard frequent itemset mining naar onze relationele itemsets. Hier bovenop definieerden we ook een nieuwe maat, deviation genaamd, die ons toelaat om meer focus te leggen op het ontdekken van onverwachte patronen.
  273. Zowel voor het Conqueror algoritme als voor het SMuRFIG algoritme bekeken we in ons proefschrift enkele oplossingen voor die ik slechts kort zal opsommen. Voor Conqueror keken we naar het detecteren van afhankelijkheden in de data. Afhankelijkheden in de data kunnen namelijk veel redundante patronen opleveren. Door deze echter eerst te ontdekken kunnen we vele redundanties vermijden. Ook bij het SMuRFIG algoritme keken we naar het elimineren van redundantie en veralgemeenden we enkele technieken uit standaard frequent itemset mining naar onze relationele itemsets. Hier bovenop definieerden we ook een nieuwe maat, deviation genaamd, die ons toelaat om meer focus te leggen op het ontdekken van onverwachte patronen.
  274. Zowel voor het Conqueror algoritme als voor het SMuRFIG algoritme bekeken we in ons proefschrift enkele oplossingen voor die ik slechts kort zal opsommen. Voor Conqueror keken we naar het detecteren van afhankelijkheden in de data. Afhankelijkheden in de data kunnen namelijk veel redundante patronen opleveren. Door deze echter eerst te ontdekken kunnen we vele redundanties vermijden. Ook bij het SMuRFIG algoritme keken we naar het elimineren van redundantie en veralgemeenden we enkele technieken uit standaard frequent itemset mining naar onze relationele itemsets. Hier bovenop definieerden we ook een nieuwe maat, deviation genaamd, die ons toelaat om meer focus te leggen op het ontdekken van onverwachte patronen.
  275. Met deze toevoegingen vormen zowel het Conqueror algoritme als het SMuRFIG algoritme twee praktische methoden om nieuwe patronen te ontdekken in relationele databases.
  276. En hiermee besluit ik mijn presentatie. Ik dank u voor uw aandacht.