Доклад на конференции профессоров РАН по Отделению математических наук РАН.
15 июня 2016 г. 15:25, г. Москва, ул. Губкина, д. 8, Математический институт имени В. А. Стеклова Российской Академии наук
http://www.mathnet.ru/conf908
2. Конференция профессоров ОМН РАН 14 июня 2016 года 2 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ООббллаассттьь ииссссллееддоовваанниийй
ААннааллиизз ддаанннныыхх ((DDaattaa MMiinniinngg))
ММаашшииннннооее ооббууччееннииее ((MMaacchhiinnee LLeeaarrnniinngg))
3. Конференция профессоров ОМН РАН 14 июня 2016 года 3 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ООббллаассттьь ииссссллееддоовваанниийй
ЗЗааддааччии ммаашшииннннооггоо ооббууччеенниияя::
ккллаассссииффииккаацциияя ((рраассппооззннааввааннииее))
ррееггрреессссиияя
ппррооггннооззииррооввааннииее
ППррииммееррыы::
ккллаассссииффииккаацциияя ссппааммаа
ккааттееггооррииззаацциияя ттееккссттоовв
ддееттееккттииррооввааннииее ннееииссппррааввннооссттеейй
ппррееддссккааззааннииее ддееййссттввиийй
ппооллььззооввааттееллеейй
ААллггееббррааииччеессккиийй ппооддххоодд кк рреешшееннииюю ззааддаачч ааннааллииззаа ддаанннныыхх
((ЮЮ..ИИ.. ЖЖууррааввллёёвв))
ооппееррааццииии ннаадд ааллггооррииттммааммии
ооббооссннооввааннииее ккооррррееккттннооссттии ппооллииннооммоовв ннаадд ааллггооррииттммааммии
4. Конференция профессоров ОМН РАН 14 июня 2016 года 4 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ААллггееббррааииччеессккиийй ппооддххоодд кк рреешшееннииюю ззааддаачч
рраассппооззннаавваанниияя//ккллаассссииффииккааццииии
11 1 11 11 1
0
1 1
1 1
B Cl l
q q ql q q ql
l l
S S
I
S S
,
ммааттррииццаа ооццеенноокк ммааттррииццаа ккллаассссииффииккаацциийй
~ij
« i j
S K »
A B C ,
B –– рраассппооззннааюющщиийй ооппееррааттоорр,,
C –– рреешшааюющщееее ппррааввииллоо..
ммооддеелльь ААВВОО ((ааллггооррииттммыы ввыыччииссллеенниияя ооццеенноокк))
5. Конференция профессоров ОМН РАН 14 июня 2016 года 5 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ААллггееббрраа ннаадд ааллггооррииттммааммии
ООппееррааццииии ннаадд рраассппооззннааюющщииммии ооппееррааттооррааммии::
1 2 1 2
[ ] [ ] [ ]B B B B ,
[ ] [ ]cB c B ,
1 2 1 2
[ ] [ ] [ ]B B B B .
ЛЛииннееййннооее ззааммыыккааннииее *
( )BL ммнноожжеессттвваа *
B :
* *
1 1 1 1
( ) { | {1,2, }, , , , , , }r r r r
B c B c B r c c B B B L Q .
ААллггееббррааииччеессккооее ззааммыыккааннииее k --йй ссттееппееннии *
( )k
BU :
* *
1 1
( ) ({ | , , , 1 })k
s s
B B B B B B s k U L .
ААллггееббррааииччеессккооее ззааммыыккааннииее::
* *
1
( ) ( )k
k
B B
U U .
6. Конференция профессоров ОМН РАН 14 июня 2016 года 6 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ААллггееббрраа ннаадд ааллггооррииттммааммии
ООппррееддееллееннииее.. ММооддеелльь рраассппооззннааюющщиихх ооппееррааттоорроовв *
R ннааззыыввааееттссяя
ккооррррееккттнноойй ((ооттннооссииттееллььнноо ззааддааччии рраассппооззннаавваанниияя)),, еессллии
q l
Q *
B R : [ ]B .
ТТееооррееммаа.. ММооддеелльь )( *BU ккооррррееккттннаа ттооггддаа ии ттооллььккоо ттооггддаа,, ккооггддаа
ввыыппооллннеенныы ппееррввооее ии ввттооррооее ууссллооввиияя ррееггуулляяррннооссттии..
11––33 ууссллооввиияя ррееггуулляяррннооссттии –– ЖЖууррааввллёёвв ЮЮ..ИИ.. ((11997777 гг..))
11––22 ууссллооввиияя ррееггуулляяррннооссттии –– ДДооккууккиинн АА..АА.. ((22000011 гг..))
8. Конференция профессоров ОМН РАН 14 июня 2016 года 8 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ННооввыыее ккррииттееррииии ккооррррееккттннооссттии ааллггееббррааииччеессккооггоо ззааммыыккаанниияя ккооннееччнноойй
ссттееппееннии ии ккррииттееррииии ррааззрреешшииммооссттии ззааддаачч ааллггооррииттммааммии иизз ээттооггоо
ззааммыыккаанниияя
ППооссттррооеенноо ммнноожжеессттввоо ооппееррааттоорроовв QLjijiB ),(),( }{ ,, },,2,1{},,2,1{ lqQL ::
ТТееооррееммаа.. ППррии k
k
F F , {1,2, }k , ссппррааввееддллииввоо ррааввееннссттввоо
*
( , ) ( , )
({ ( )} ) ( )k
k i j i j QL
F B B
L U .
kF –– ппооллннооссттььюю ооппииссаанноо ПП..АА.. ККааррппооввииччеемм ((22001100 гг..))
ППооллииннооммыы ЮЮ..ИИ.. ЖЖууррааввллёёвваа ((11997777 гг..)) ППооллууччееннииее ллююббоойй ммааттррииццыы ооццееннккии
(ддлляя
*
( )k
BU )
i
ik
iiBc )(
QLba
k
baba Bc
),(
),(),(
( , ) ( , )
( , )
( )a b k a b
a b QL
c F B
9. Конференция профессоров ОМН РАН 14 июня 2016 года 9 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ННееууллууччшшааееммааяя вв ооббщщеемм ссллууччааее ооццееннккаа ссттееппееннии ккооррррееккттннооггоо
ааллггееббррааииччеессккооггоо ззааммыыккаанниияя ммооддееллии ААВВОО
~ logk q q –– ЮЮ..ИИ.. ЖЖууррааввллёёвв ((11997777 гг..))
2k q l –– ВВ..ЛЛ.. ММааттррооссоовв ((11998855 гг..))
k m –– ТТ..ВВ.. ППллооххооннииннаа ((11998877 гг..))
2
logk ql –– КК..ВВ.. РРууддааккоовв ((11998899 гг..))
ТТооччннааяя ооццееннккаа ((ооббщщиийй ссллууччаайй))::
2 2
log logk q l
q –– ччииссллоо ккооннттррооллььнныыхх ооббъъееккттоовв,, l –– ккллаассссоовв,, m –– ээттааллоонннныыхх ооббъъееккттоовв..
10. Конференция профессоров ОМН РАН 14 июня 2016 года 10 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ННееууллууччшшааееммааяя вв ооббщщеемм ссллууччааее ооццееннккаа ссттееппееннии ккооррррееккттннооггоо
ааллггееббррааииччеессккооггоо ззааммыыккаанниияя ммооддееллии ААВВОО
ТТееооррееммаа.. ММооддеелльь *
( )BU ккооррррееккттннаа ттооггддаа ии ттооллььккоо ттооггддаа,, ккооггддаа
ккооррррееккттннаа ммооддеелльь *
( )k
BU ,, ггддее 2 2
log logk q l .
ТТееооррееммаа.. ДДлляя ллююббыыхх ннааттууррааллььнныыхх ппааррааммееттрроовв q ии l , 2q l ,
ссуущщеессттввууеетт ррееггуулляяррннааяя ззааддааччаа рраассппооззннаавваанниияя,, вв ккооттоорроойй ммооддеелльь
*
( )k
BU ннееккооррррееккттннаа ппррии 2 2
log logk q l .
ТТааккжжее ппооллууччеенныы ттооччнныыее ооццееннккии ддлляя ччаассттнныыхх ссллууччааеевв..
11. Конференция профессоров ОМН РАН 14 июня 2016 года 11 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ППооппооллннееннииее ллииннееййннооггоо ззааммыыккаанниияя ммнноожжеессттвваа ппооллииннооммоовв
ооггррааннииччеенннноойй ссттееппееннии ннаадд ААВВОО ооппеерраацциияяммии ннооррммииррооввккии ии ддееллеенниияя
ООппррееддееллееннииее.. ССттааннддааррттнныымм ззааммыыккааннииеемм ооттннооссииттееллььнноо ооппеерраацциийй иизз
Op ммнноожжеессттвваа *
H ннааззыыввааееттссяя ммнноожжеессттввоо
* * * *
Op
Op ( ) { ( ) | ( ) ( )}
F
H F H H H M F H
L L L L ,
ггддее *
( )M F –– ооббллаассттьь ооппррееддееллеенниияя ооппееррааццииии F .
ТТееооррееммаа.. ЗЗааммыыккааннииее *
D ( )BL L ккооррррееккттнноо ттооггддаа ии ттооллььккоо ттооггддаа,, ккооггддаа
ззааммыыккааннииее *
( )BU ккооррррееккттнноо,, ггддее D –– ннееппррееррыыввннааяя ффууннккцциияя,, ооттллииччннааяя
оотт ппооллииннооммаа..
)5(D3)2(D 32121 BBBBB ))(D2(D 21 BB
12. Конференция профессоров ОМН РАН 14 июня 2016 года 12 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
ККооррррееккттннооссттии ммооддееллии ооттннооссииттееллььнноо ссееммееййссттвваа рреешшааюющщиихх ппррааввиилл
ППууссттьь *
C –– ммнноожжеессттввоо рреешшааюющщиихх ппррааввиилл,,
*
–– ммнноожжеессттввоо ккллаассссииффииккаацциийй ((q l --ммааттрриицц))..
ООппррееддееллееннииее.. ММооддеелльь *
R ((рраассппооззннааюющщиихх ооппееррааттоорроовв)) ннааззыыввааееттссяя
*
C - *
--ккооррррееккттнноойй,, еессллии
*
*
B R , *
C C : ( [ ])C B .
ВВ ббооллььшшииннссттввее ссллууччааеевв ккооррррееккттннооссттьь ээккввииввааллееннттннаа
*
C - *
--ккооррррееккттннооссттии..
13. Конференция профессоров ОМН РАН 14 июня 2016 года 13 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
11--ссииннггуулляяррннооссттьь ккооннееччнноойй ссииссттееммыы ттооччеекк
((ввыырроожжддееннннооссттьь ммааттррииццыы ппооппааррнныыхх ll11--рраассссттоояянниийй ээттоойй ссииссттееммыы))
РРееззууллььттааттыы ИИ.. ШШёённббееррггаа:: ННееввыырроожжддееннннооссттьь ммааттрриицц ппооппааррнныыхх
рраассссттоояянниийй ддлляя ккооннееччнноойй ссииссттееммыы 1{ }q
i is ррааззллииччнныыхх ттооччеекк
ппррооссттррааннссттвваа m
R ии ммееттррииккии pl , 1 2p , 1q .
0112
1021
1201
2110
14. Конференция профессоров ОМН РАН 14 июня 2016 года 14 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
11--ссииннггуулляяррннооссттьь ккооннееччнноойй ссииссттееммыы ттооччеекк
ТТееооррееммаа.. ССииссттееммаа ттооччеекк q
iisS 1}~{ яяввлляяееттссяя 1--ссииннггуулляяррнноойй ттооггддаа ии
ттооллььккоо ттооггддаа,, ккооггддаа ссуущщеессттввууеетт ттааккооее ппооддммнноожжеессттввоо },,2,1{ qX ,, ччттоо
ддлляя ллююббооггоо ппррееооббррааззоовваанниияя Gg ссииссттееммаа ттооччеекк Xiisg )}~({ ннее ооттддееллииммаа
оотт ссииссттееммыы ттооччеекк Xqiisg },,2,1{)}~({ ггииппееррппллооссккооссттььюю
ТТееооррееммаа.. ССииссттееммаа ттооччеекк q
iisS 1}~{ ппррооссттррааннссттвваа m
R яяввлляяееттссяя
1--ссииннггуулляяррнноойй ттооггддаа ии ттооллььккоо ттооггддаа,, ккооггддаа
}0
~
{),,( т
1
q
qcc R :: m
s R~ 0)~,~(
1
q
i
ii ssc ,,
ггддее –– ммееттррииккаа ХХээммммииннггаа ииллии 1l --ммееттррииккаа..
19. Конференция профессоров ОМН РАН 14 июня 2016 года 19 слайд из 19
Алгебраический подход к анализу данных и его приложения А.Г. Дьяконов (ВМК МГУ, ВЦ ФИЦ ИУ РАН)
Алгоритм вычисления оценок (обобщённый)
– суперпозиция распознающего оператора (B) и решающего правила (C): A B C .
Распознающий оператор B
Оценка принадлежности объекта i
S к классу j
K
1,1
,
, 0,0
[ ] ( ) ( ) ( , )
t a
A j
t e b t
ij ab i
a b S K
B x j w w S S
,
где t
w
Q при {1,2, , }t m (вес t-го объекта), ( )w
Q при A
(вес учёта -й
близости), A Z
, ,
( , )e b t
i
S S
– функция близости:
,1 ,0 1, ( , ) ,
( , ) 1 ( , )
0, ( , ) ,
t
e t e t i
ti i
i
S S e
S S S S
S S e
(или другой вид)
e – параметры функции (из множества Z
),
, 1,
, 0.
m
a j
mj
j
S K a
K
S K a