clasification

NLPseminar
NLPseminarProject manager in Linguistic group à NLPseminar
Автоматическая классификация текстов с использованием латентно-семантического анализа Соловьев Алексей Auditech Ltd. ;   СПбГУ
Алгоритмы классификации ,[object Object],[object Object]
Критерии оценки алгоритмов  ,[object Object],[object Object],[object Object],[object Object],[object Object]
Постановка задачи  ,[object Object],[object Object],[object Object]
Обзор существующих методов и алгоритмов ,[object Object],[object Object],[object Object],[object Object],[object Object]
Латентно-семантический анализ  ,[object Object],[object Object],[object Object],[object Object]
SVD  разложение матрицы ,[object Object],[object Object],[object Object]
SVD  разложение матрицы Рисунок 1.  SVD  разложение матрицы А размерности ( T X D ) на матрицу термов  U  размерности ( T X k ), матрицу документов  V  размерности ( k X D ) и диагональную матрицу  S  размерности ( k X k ), где  k  – количество сингулярных значении диагональной матрицы  S .
SVD  разложение матрицы ,[object Object],[object Object],[object Object]
Три основных разновидности решения задачи методом ЛСА: ,[object Object],[object Object],[object Object]
Два варианта применения латентно-семантического анализа ,[object Object],[object Object],[object Object],[object Object],[object Object]
Исследование ЛСА на материале базы спонтанной русской речи ,[object Object],[object Object],[object Object],[object Object],[object Object]
Материал для тестирования  ,[object Object],[object Object],[object Object]
Сегментация текста на термы ,[object Object],[object Object],[object Object],[object Object]
Расчет весовых функций ,[object Object],[object Object]
Определение тематик документов ,[object Object]
Сравнительная таблица пересечения основных факторов ,[object Object],100 9 9 30+ 89 8 10 50 78 7 8 30 56 5 6 20 Пересечение с текстом 30+ (%)  Кол-во факторов, совпавших с 30+  Приблизительное кол-во факторов  Кол-во документов
Выбор порога для сингулярных элементов диагональной матрицы при  SVD  анализе ,[object Object]
Выбор порога для сингулярных элементов диагональной матрицы при  SVD  анализе ,[object Object]
Выбор критерия ограничения величины весовых функций при получении ассоциативного словаря ,[object Object]
Результаты тестирования на речевой базе русской речи  ,[object Object],77,6  ½  80,2  ¼  82,2  90,8  88,1  полная база  ½ (%)  ¾ (%)  полная база (%)  Тест обучение
SVD  анализ   ,[object Object],[object Object],[object Object]
Выводы ,[object Object],[object Object],[object Object]
Изменение главных факторов при уменьшении числа сингулярных диагональных элементов матрицы
Изменение главных факторов при уменьшении числа сингулярных диагональных элементов матрицы
Области применения ЛСА ,[object Object],[object Object],[object Object],[object Object],[object Object]
СПАСИБО ЗА ВНИМАНИЕ!
Некоторые Интернет-ресурсы, посвященные ЛСА ,[object Object],[object Object],[object Object],[object Object]
1 sur 28

Recommandé

03 кластеризация документов par
03 кластеризация документов03 кластеризация документов
03 кластеризация документовLidia Pivovarova
2.1K vues46 diapositives
Konstantion Vorontsov - Additive regularization of matrix decompositons and p... par
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...Konstantion Vorontsov - Additive regularization of matrix decompositons and p...
Konstantion Vorontsov - Additive regularization of matrix decompositons and p...AIST
1.7K vues51 diapositives
Мищенко. Методы автоматического определения наиболее частотного значения слова. par
Мищенко. Методы автоматического определения наиболее частотного значения слова.Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
416 vues29 diapositives

Contenu connexe

Tendances

Rule b platf par
Rule b platfRule b platf
Rule b platfNatalia Ostapuk
376 vues20 diapositives
Zyabrev - par
Zyabrev - Zyabrev -
Zyabrev - Anna
358 vues25 diapositives
л 2 7 par
л 2 7л 2 7
л 2 7Kirill Bystrov
477 vues33 diapositives
Можарова Тематические модели: учет сходства между униграммами и биграммами. par
Можарова Тематические модели: учет сходства между униграммами и биграммами.Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
620 vues39 diapositives
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО... par
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...ITMO University
280 vues5 diapositives

Tendances(7)

Zyabrev - par Anna
Zyabrev - Zyabrev -
Zyabrev -
Anna358 vues
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО... par ITMO University
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...
МЕТОД НАВИГАЦИИ ПО ТЕКСТУ ДОКУМЕНТА С ПОМОЩЬЮ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЕГО СО...
ITMO University280 vues
C++ осень 2012 лекция 4 par Technopark
C++ осень 2012 лекция 4C++ осень 2012 лекция 4
C++ осень 2012 лекция 4
Technopark363 vues

Similaire à clasification

isp_23_2012_215.pdf par
isp_23_2012_215.pdfisp_23_2012_215.pdf
isp_23_2012_215.pdfGrishan1
1 vue16 diapositives
!Predictive analytics part_3 par
!Predictive analytics part_3!Predictive analytics part_3
!Predictive analytics part_3Vladimir Krylov
808 vues77 diapositives
Кластеризация русскоязычных текстов на основе латентно-семантического анализа par
Кластеризация русскоязычных текстов на основе латентно-семантического анализаКластеризация русскоязычных текстов на основе латентно-семантического анализа
Кластеризация русскоязычных текстов на основе латентно-семантического анализаСпецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
2.5K vues14 diapositives
Chernyak_defense par
Chernyak_defenseChernyak_defense
Chernyak_defenseEkaterina Chernyak
324 vues40 diapositives
Автоматическое извлечение синтаксических контекстов из текстовой коллекции par
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииАвтоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииСпецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ
606 vues40 diapositives

Similaire à clasification(20)

isp_23_2012_215.pdf par Grishan1
isp_23_2012_215.pdfisp_23_2012_215.pdf
isp_23_2012_215.pdf
Grishan11 vue
Базы данных лекция №5 par Vitaliy Pak
Базы данных лекция №5Базы данных лекция №5
Базы данных лекция №5
Vitaliy Pak435 vues
Построение правил для автоматического извлечения словосочетаний из текста par Irene Pochinok
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текста
Irene Pochinok260 vues
построение правил для автоматического извлечения словосочетаний из текста par Yury Katkov
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текста
Yury Katkov768 vues
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД... par ITMO University
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
ОСНОВНЫЕ ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ ПРЕОБРАЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО КОД...
ITMO University261 vues
3 бурдаеввп 2014_pax_grid_без_анимации par Vladimir Burdaev
3 бурдаеввп 2014_pax_grid_без_анимации3 бурдаеввп 2014_pax_grid_без_анимации
3 бурдаеввп 2014_pax_grid_без_анимации
Vladimir Burdaev212 vues
Data base par sng
Data baseData base
Data base
sng476 vues
008 par JIuc
008008
008
JIuc203 vues
базы данных.назаров par Different_56
базы данных.назаровбазы данных.назаров
базы данных.назаров
Different_56526 vues

Plus de NLPseminar

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо par
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна ЛандоNLPseminar
750 vues57 diapositives
Events par
EventsEvents
EventsNLPseminar
928 vues22 diapositives
Tomita par
TomitaTomita
TomitaNLPseminar
9.2K vues105 diapositives
бетин par
бетинбетин
бетинNLPseminar
1.8K vues16 diapositives
Andreev par
AndreevAndreev
AndreevNLPseminar
537 vues12 diapositives
клышинский par
клышинскийклышинский
клышинскийNLPseminar
911 vues24 diapositives

Plus de NLPseminar(20)

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо par NLPseminar
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
NLPseminar750 vues
клышинский par NLPseminar
клышинскийклышинский
клышинский
NLPseminar911 vues
конф ии и ея гаврилова par NLPseminar
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гаврилова
NLPseminar1.1K vues
кудрявцев V3 par NLPseminar
кудрявцев V3кудрявцев V3
кудрявцев V3
NLPseminar890 vues
акинина осмоловская par NLPseminar
акинина осмоловскаяакинина осмоловская
акинина осмоловская
NLPseminar678 vues
molchanov(promt) par NLPseminar
molchanov(promt)molchanov(promt)
molchanov(promt)
NLPseminar1.1K vues
белканова par NLPseminar
белкановабелканова
белканова
NLPseminar707 vues
гвоздикин par NLPseminar
гвоздикингвоздикин
гвоздикин
NLPseminar547 vues
веселов par NLPseminar
веселоввеселов
веселов
NLPseminar17.4K vues

clasification