Submit Search
Upload
10.000 вариантов снять квартиру или сам себе POE-риелтор
•
1 like
•
557 views
M
mayperl
Follow
YAPC Russia 2009 "May Perl 2"
Read less
Read more
Technology
Report
Share
Report
Share
1 of 22
Download now
Download to read offline
Recommended
मैं और मेरे पिताजीं Father and i
मैं और मेरे पिताजीं Father and i
Narayanasamy Prasannam
Punjabi
Punjabi
Kaur Nav
Roadmap to Recovery
Roadmap to Recovery
Obama White House
Human Behavior online: a Psychologist's perspective - Nathalie Nahai
Human Behavior online: a Psychologist's perspective - Nathalie Nahai
Brandwatch
Amit Gupta -Resume
Amit Gupta -Resume
Amit Gupta
EAGaminiFonseka
EAGaminiFonseka
EA Gamini Fonseka
Succeeding with Customer Advisory Boards - Jim Berets (ProductCamp Boston 2015)
Succeeding with Customer Advisory Boards - Jim Berets (ProductCamp Boston 2015)
ProductCamp Boston
Lunchtime presentation: Intersections of Product Management - C.Todd Lombardo...
Lunchtime presentation: Intersections of Product Management - C.Todd Lombardo...
ProductCamp Boston
Recommended
मैं और मेरे पिताजीं Father and i
मैं और मेरे पिताजीं Father and i
Narayanasamy Prasannam
Punjabi
Punjabi
Kaur Nav
Roadmap to Recovery
Roadmap to Recovery
Obama White House
Human Behavior online: a Psychologist's perspective - Nathalie Nahai
Human Behavior online: a Psychologist's perspective - Nathalie Nahai
Brandwatch
Amit Gupta -Resume
Amit Gupta -Resume
Amit Gupta
EAGaminiFonseka
EAGaminiFonseka
EA Gamini Fonseka
Succeeding with Customer Advisory Boards - Jim Berets (ProductCamp Boston 2015)
Succeeding with Customer Advisory Boards - Jim Berets (ProductCamp Boston 2015)
ProductCamp Boston
Lunchtime presentation: Intersections of Product Management - C.Todd Lombardo...
Lunchtime presentation: Intersections of Product Management - C.Todd Lombardo...
ProductCamp Boston
Playlistify The Next Web
Playlistify The Next Web
Roeland P Landegent
Recursos tecnologicos na educacao moda_ou_necessidade
Recursos tecnologicos na educacao moda_ou_necessidade
Neuza Pedro
Brian's Program Testimonials - Part 2
Brian's Program Testimonials - Part 2
Prof Brian Peskin
Bhutan Tour Package
Bhutan Tour Package
Apna Bharat Tours & Travels
Character Cakes Brochure • Bengawan Solo
Character Cakes Brochure • Bengawan Solo
Toolbox Design
Havacilik
Havacilik
Kemal Kömürcü
はてなダイアリーキーワードをつくってみたよ
はてなダイアリーキーワードをつくってみたよ
Tsukasa Oishi
Campbell & Readman - TDD It's Not Tester Driven Development - EuroSTAR 2012
Campbell & Readman - TDD It's Not Tester Driven Development - EuroSTAR 2012
TEST Huddle
How to Résumé
How to Résumé
Matt Ray
Implementation methods
Implementation methods
BioREDs
Scotland Public Opinion Monitor August 2014
Scotland Public Opinion Monitor August 2014
Ipsos UK
Matriz Cannes Lions 2016 Report
Matriz Cannes Lions 2016 Report
Mauricio Oliveira
You've Changed: Field Audit Trails and the Salesforce Time Machine
You've Changed: Field Audit Trails and the Salesforce Time Machine
Dreamforce
XPages Blast - Lotusphere 2012
XPages Blast - Lotusphere 2012
Tim Clark
Тестирование в проекте REG.RU
Тестирование в проекте REG.RU
mayperl
Use Perl like Perl
Use Perl like Perl
mayperl
Anyevent
Anyevent
mayperl
Perl + nginx = ♥
Perl + nginx = ♥
mayperl
Browser sniffing в 21 веке
Browser sniffing в 21 веке
mayperl
А у нас Perl 6 в production :)
А у нас Perl 6 в production :)
mayperl
Что будет с Перлом?
Что будет с Перлом?
mayperl
Использование WebMoney в Perl
Использование WebMoney в Perl
mayperl
More Related Content
Viewers also liked
Playlistify The Next Web
Playlistify The Next Web
Roeland P Landegent
Recursos tecnologicos na educacao moda_ou_necessidade
Recursos tecnologicos na educacao moda_ou_necessidade
Neuza Pedro
Brian's Program Testimonials - Part 2
Brian's Program Testimonials - Part 2
Prof Brian Peskin
Bhutan Tour Package
Bhutan Tour Package
Apna Bharat Tours & Travels
Character Cakes Brochure • Bengawan Solo
Character Cakes Brochure • Bengawan Solo
Toolbox Design
Havacilik
Havacilik
Kemal Kömürcü
はてなダイアリーキーワードをつくってみたよ
はてなダイアリーキーワードをつくってみたよ
Tsukasa Oishi
Campbell & Readman - TDD It's Not Tester Driven Development - EuroSTAR 2012
Campbell & Readman - TDD It's Not Tester Driven Development - EuroSTAR 2012
TEST Huddle
How to Résumé
How to Résumé
Matt Ray
Implementation methods
Implementation methods
BioREDs
Scotland Public Opinion Monitor August 2014
Scotland Public Opinion Monitor August 2014
Ipsos UK
Matriz Cannes Lions 2016 Report
Matriz Cannes Lions 2016 Report
Mauricio Oliveira
You've Changed: Field Audit Trails and the Salesforce Time Machine
You've Changed: Field Audit Trails and the Salesforce Time Machine
Dreamforce
XPages Blast - Lotusphere 2012
XPages Blast - Lotusphere 2012
Tim Clark
Viewers also liked
(14)
Playlistify The Next Web
Playlistify The Next Web
Recursos tecnologicos na educacao moda_ou_necessidade
Recursos tecnologicos na educacao moda_ou_necessidade
Brian's Program Testimonials - Part 2
Brian's Program Testimonials - Part 2
Bhutan Tour Package
Bhutan Tour Package
Character Cakes Brochure • Bengawan Solo
Character Cakes Brochure • Bengawan Solo
Havacilik
Havacilik
はてなダイアリーキーワードをつくってみたよ
はてなダイアリーキーワードをつくってみたよ
Campbell & Readman - TDD It's Not Tester Driven Development - EuroSTAR 2012
Campbell & Readman - TDD It's Not Tester Driven Development - EuroSTAR 2012
How to Résumé
How to Résumé
Implementation methods
Implementation methods
Scotland Public Opinion Monitor August 2014
Scotland Public Opinion Monitor August 2014
Matriz Cannes Lions 2016 Report
Matriz Cannes Lions 2016 Report
You've Changed: Field Audit Trails and the Salesforce Time Machine
You've Changed: Field Audit Trails and the Salesforce Time Machine
XPages Blast - Lotusphere 2012
XPages Blast - Lotusphere 2012
More from mayperl
Тестирование в проекте REG.RU
Тестирование в проекте REG.RU
mayperl
Use Perl like Perl
Use Perl like Perl
mayperl
Anyevent
Anyevent
mayperl
Perl + nginx = ♥
Perl + nginx = ♥
mayperl
Browser sniffing в 21 веке
Browser sniffing в 21 веке
mayperl
А у нас Perl 6 в production :)
А у нас Perl 6 в production :)
mayperl
Что будет с Перлом?
Что будет с Перлом?
mayperl
Использование WebMoney в Perl
Использование WebMoney в Perl
mayperl
Вебклуб Perlgolf.ru
Вебклуб Perlgolf.ru
mayperl
Perl в хэке и хэки в Perl
Perl в хэке и хэки в Perl
mayperl
Работа с большими файлами под перлом
Работа с большими файлами под перлом
mayperl
Сравнение работы алгоритмов сортировки, реализованных на Perl
Сравнение работы алгоритмов сортировки, реализованных на Perl
mayperl
Курс Perl в УрГУ
Курс Perl в УрГУ
mayperl
Ведение документации в perl6: POD, да не тот !
Ведение документации в perl6: POD, да не тот !
mayperl
Making Your Own CPAN
Making Your Own CPAN
mayperl
Распределенная обработка потоковых данных
Распределенная обработка потоковых данных
mayperl
Упаковка и развертывание программ на perl под debian
Упаковка и развертывание программ на perl под debian
mayperl
Groovy Vs Perl
Groovy Vs Perl
mayperl
Написание DSL в Perl
Написание DSL в Perl
mayperl
More from mayperl
(19)
Тестирование в проекте REG.RU
Тестирование в проекте REG.RU
Use Perl like Perl
Use Perl like Perl
Anyevent
Anyevent
Perl + nginx = ♥
Perl + nginx = ♥
Browser sniffing в 21 веке
Browser sniffing в 21 веке
А у нас Perl 6 в production :)
А у нас Perl 6 в production :)
Что будет с Перлом?
Что будет с Перлом?
Использование WebMoney в Perl
Использование WebMoney в Perl
Вебклуб Perlgolf.ru
Вебклуб Perlgolf.ru
Perl в хэке и хэки в Perl
Perl в хэке и хэки в Perl
Работа с большими файлами под перлом
Работа с большими файлами под перлом
Сравнение работы алгоритмов сортировки, реализованных на Perl
Сравнение работы алгоритмов сортировки, реализованных на Perl
Курс Perl в УрГУ
Курс Perl в УрГУ
Ведение документации в perl6: POD, да не тот !
Ведение документации в perl6: POD, да не тот !
Making Your Own CPAN
Making Your Own CPAN
Распределенная обработка потоковых данных
Распределенная обработка потоковых данных
Упаковка и развертывание программ на perl под debian
Упаковка и развертывание программ на perl под debian
Groovy Vs Perl
Groovy Vs Perl
Написание DSL в Perl
Написание DSL в Perl
10.000 вариантов снять квартиру или сам себе POE-риелтор
1.
10.000 вариантов снять
квартиру или сам себе POE-риелтор
2.
3.
Вид каталога
4.
Идентификатор
5.
Подробная информация
6.
Паук на POE и
драйверная система
7.
Структура драйвера {
name => 'landlord', url => sub { ... }, url_details => sub { ... }, types => { app_for_sale => 'flat', rent_flat => 'flat', house_for_sale => 'house', rent_house => 'house', }, connection_options => { keep_alive => 0, }, parsers => { count => sub { ... }, details => sub { ... }, items => sub { ... }, }, }
8.
3 функции для
разбора собранных страниц parsers => { count => sub { ... }, details => sub { ... }, items => sub { ... }, },
9.
2 Функции
для генерации ссылок url => sub { ... }, url_details => sub { ... },
10.
Драйвер готов!
11.
Основные этапы
работы
12.
1. Инициализация Определение
количества страниц каталога
13.
2. Сбор каталога
Сбор страниц по подготовленным ссылкам
14.
3. Анализ собранных
объектов Сравнение объектов в нашей БД и в каталоге-источнике
15.
4. Сбор подробной
информации по новым объектам
16.
Необычный поиск • Получить
идентификатор с помощью LWP::UserAgent • Генерировать ссылки с использованием идентификатора
17.
Ошибки в каталогах
18.
POE::Component::Client::Keepalive
v 0.25
19.
Сервера риелторов не
выдерживали нагрузок Apache + CGI = 5 запросов одновременно
20.
Маленькие радости Отдельное “спасибо”
разработчикам, сделавшим параметр «количество объектов на странице»
21.
Полуавтоматический режим
Меняется представление информации, необходимо постоянно поддерживать работу пауков
22.
Спасибо за внимание! Константинов
Дмитрий RostovOnDon.pm
Download now