Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Web scraping
1. S
Vét dữ liệu từ Internet
bằng Mechanize
WWW Scraping
2. Nguyễn Bỉnh Diệu
(Justin)
Web (Ruby on Rails) & iOS
developer at Zoy Viet Nam
https://github.com/dieunb
3. Tại sao và như thế nào?
• Dữ liệu không phải lúc nào cũng là
Json.
• Dữ liệu không phải do mình quản lý.
• Cần tự động hóa.
Sử dụng các công cụ để thực hiện việc
này.
Scriping language là lựa chọn phổ biến
cho việc scraping: Perl, Python, Ruby.
6. Điều kiện để scraping
1. Nội dung cần lấy có bản quyền không?
2.Trang web lấy dữ liệu có cho phép scraping
không?
3. Dữ liệu được bảo vệ từ phía server không?