Unit102. ความหมายของการ
สื บ ค้ น สารสนเทศ
การสื บ ค้ น สารสนเทศ
(Information retrieval
หรื อ Information
searching) หมายถึ ง
กระบวนการในการค้ น หา
ข้ อ มู ล หรื อ สารสนเทศที ่
ต้ อ งการ โดยใช้ เ ครื ่ อ งมื อ
ช่ ว ยค้ น
3. วั ต ถุ ป ระสงค์ ข อง
การสื บ ค้ น ข้ อ มู ล
1. เพื ่ อ การศึ ก ษา
2. เพื ่ อ หาข้ อ มู ล หรื อ ความ
รู ้ ใ หม่ ๆ
3. เพื ่ อ ความบั น เทิ ง และ
การพั ก ผ่ อ นหย่ อ นใจ
4. เพื ่ อ ประกอบการ
ทำ า งาน การค้ า การ
4. เครื ่ อ งมื อ ช่ ว ยค้ น
หมายถึ ง สื ่ อ หรื อ อุ ป กรณ์ ท ี ่ ช ่ ว ย
ให้ ผ ู ้ ใ ช้ บ ริ ก ารสามารถค้ น หา
ข้ อ มู ล ที ่ ต ้ อ งการได้ ส ะดวก
รวดเร็ ว และตรงตามความต้ อ งการ
จากรายการทรั พ ยากรสารสนเทศ
ที ่ ห ้ อ งสมุ ด จำ า ทำ า ขึ ้ น อย่ า งเป็ น
ระบบ
5. Introduction to finding information
on the Web
- เครือข่าย WWW ได้เปลียนวิถีการ
่
ดำาเนินงานของ
องค์กรต่างๆ
- WWW เป็นแหล่งทรัพยากร
สารสนเทศที่ใหญ่ทสุด ี่
ในโลก
- มีเครืองมือช่วยสืบค้นข้อมูล
่
(Search Engine หรือ Search
6. หลักการเบื้องต้นในการสืบค้น
ข้อมูล
สารสนเทศบนเว็บไซต์
1. รูจักทีอยู่ของ Website ที่ตองการ
้ ่ ้
ค้นหา
2. รูจักวิธการค้น เช่น การค้นจาก
้ ี
บัญชีหวเรือง (Subject Directory)
ั ่
เช่น Yahoo.com
3. รูจักวิธการอ่านผลการสืบค้น
้ ี
4. รูจักวิธการจัดเก็บผลการสืบค้น
้ ี
5. รูจักวิธการเผยแพร่การสืบค้น
้ ี
7. องค์ประกอบของ WWW
1. Web Server
2. WWW Browser หรือ Web
Browser เช่น Lynx, IE ,
Netscape, Firefox
3. HTML (Hypertext Markup
Language)
4. URL (Uniform Resource
Lacator) เช่น
8. ข้อมูลที่ปกติมักไม่ปรากฏบน
WEB
- ความลับทางการค้า (Trade
Secrets)
- ฐานข้อมูลเชิงพาณิชย์ต่างๆ
(Commercial Database)
- สิ่งตีพิมพ์ที่มีลขสิทธิ์
ิ
(Copyrighted Published
Materials)
9. “ด้วยข้อมูลที่หลากหลายบน
เว็บไซต์
ดังนั้น ผู้ใช้ตองกลั่นกรอง
้
เลือกสรรข้อมูล
ที่ได้รับออกมาให้ดี และตัดสิน
ออกมาให้ได้ว่าข้อมูลที่ได้รับ
11. 2. การจำาแนกแนวคิดในคำาถา
มนั้นๆ (Identify the
Important Concepts)
การจำาแนกแนวคิดในคำาถา
มนั้นๆ ออกมาเป็นส่วนๆ เช่น
ข้อมูลเกี่ยวกับการส่งออกสินค้า
ประเภทอิเล็กทรอนิกส์ของประเทศ
Concept 1 Concept 2 Concept 3
Japan ญีปุ่น จะแยกได้เป็นElectronics
่ AND AND
Export
12. 3. การกำาหนดคำาค้น หรือการแปล
คำาถามทีต้องการสืบค้นออกมา
่
เป็นคำาค้นให้ถูกต้อง (Identify
Search Terms)
เป็นจุดสำาคัญมากทีจะช่วย
่
ให้การสืบค้นได้ผลลัพธ์ถูกต้อง
ในขันแรก ซึ่งเราควรมีการผัน
้
ตามหลักภาษาด้วย เช่น
- Synonym คือ คำาพ้องความหมาย
เดียวกัน
>> Buy – Order, Purchase
13. - English dialects คือ ภาษาพูดใน
แต่ละท้องถิน่
>> Color หรือ Colour
>> Catalog หรือ Catalogue
>> Alien -- UFO
- Truncation คือ คำารากศัพท์ชุด
เดียวกัน แตกต่างกันทีอักษรที่เชื่อม
่
ต่อด้านหลัง เช่น Prevent –
Prevention, Prevents,
Prevented, Preventing
14. 4. การเชื่อมคำา (Combining
Search Terms)
การระบุให้กลุ่มคำาทีเราต้องการ
่
สืบค้นให้มีความสัมพันธ์กันโดยมี
ตัวเชือมต่างๆ เช่น
่
4.1 Phrase Searching คือ
กลุ่มคำา หรือวลี
- World Health
Organization
- Real Estate
15. 4.2 Boolean Searching คือ ตัว
เชือม AND, OR, NOT เพื่อ
่
แสดงความสัมพันธ์ของกลุมคำาที่
่
เราต้องการสืบค้น
- AND เป็นการเชือมกลุ่มคำาที่
่
ทุกๆ คำาพ้องปรากฏขึ้นมาในเอกสาร
ฉบับเดียวกัน เป็นการระบุการสืบค้น
ให้แคบลง
- OR เป็นการเชื่อมคำาทีคำาใดคำา
่
หนึ่ง หรือทั้งหมดปรากฏขึ้นมา
เป็นการขยายการสืบค้นให้กว้างขึ้น
17. 5. เลือกใช้ Search Engine ที่
เหมาะสม
6. ทำาการสืบค้น และประเมิน
ผลข้อมูลที่ได้รับ
ปกติผลของการค้นหาข้อมูล
จะแตกต่างกันไป แต่ควร
ตรวจสอบไม่เกิน 50 อันดับ
แรกที่ส่งมาให้ และอาจ
ทำาการสืบค้นใหม่หากผลลัพธ์
20. 4. กลยุทธ์การใช้เครืองมือช่วยค้น
่
(Search Engine Strategies) เพื่อ
ให้ได้ผลลัพธ์ทตรงตามต้องการ
ี่
4.1 การใช้คำาถามที่เฉพาะเจาะจง
(Unique Keyword) เช่น ชื่อคน, ชื่อ
สินค้า ,ชื่อเฉพาะต่างๆ เป็นต้น
4.2 การใช้กลุ่มคำาหรือวลี โดยใช้
เครื่องหมายคำาพูด “...” ล้อมกลุ่มคำา
ไว้
4.3 การค้นโดยใช้เขตข้อมูล (Field
Searching) เช่น ชื่อเรื่อง (Title),
URL
21. 5. กลยุทธ์แบบหลายขั้นตอน
(Multiple Strategy) เป็นการ
รวบเอาหลายๆ กลยุทธ์มาใช้ใน
การสืบค้น ซึ่งบางครั้งอาจต้องมี
การสืบค้นหลายครั้ง หรือการ
เชือมโยงไปหลายชั้น เพื่อให้ได้
่
ผลลัพธ์ที่ตรงตามต้องการ
23. Google.com
- Search Engine ทีดีทสุดและ
่ ี่
ใหญ่ทสุดในโลก
ี่
- หาข้อมูลได้แทบทุกอย่างบน
อินเตอร์เน็ต
- มีดัชนี (Index) มากกว่า 3 พัน
ล้านเว็บเพจ
- มีการเรียกใช้บริการมากกว่า
200 ล้านครั้งต่อวัน
25. 1. เทคนิคการตั้งคีย์เวิร์ดที่ดี
คุณต้องเลือกคำาที่ระบุถึงสิ่ง
ที่ต้องการได้ชัดเจนที่สุด เช่น
ถ้าคุณต้องการค้นหาข้อมูล
เกี่ยวกับ พ๊อคเก็ตพีซี iPAQ
h2210 ก็ให้พิมพ์คำาว่า iPAQ
h2210 เข้าไปในช่องค้นหา
จะดีกว่าคำาว่า pocket PC
26. 2. กฎของคีย์เวิร์ดที่ควรทราบ
- ไม่สนใจตัวอักษรพิมพ์เล็ก (Lower
case) หรือพิมพ์ตัวใหญ่ (Upper c
ase)ดังนั้น Harry Potter = harry
potter
- คีย์เวิร์ดกับผลลัพธ์ที่ได้จะ “ตรง
เป๊ะ” เท่านั้น เช่น ค้นคำาว่าwindow
ก็จะได้คำาตอบทีไม่ใช่เว็บไซต์
่
windows เป็นต้น
- ลำาดับคำาของคีย์เวิรดทีใช้จะมีผลกับ
์ ่
ผลลัพธ์ทได้ ี่ เช่น Network
Microsoft กับ Microsoft
27. 3. AND ไม่ใส่ก็เหมือนใส่
Google จะถือว่า มีตัวเชือม
่
เป็น AND อยูระหว่างคียเวิร์ดที่
่ ์
พิมพ์เข้าไปทุกครั้ง ตัวอย่างเช่น
คำาว่า Global Network ผลลัพธ์
ที่ได้จะหมายถึง เว็บเพจทีมีทั้ง
่
คำาว่า Global และ (AND)
Network ดังนัน ถ้าคุณสนใจ
้
แค่ต้องการให้พบคำาใด คำาหนึ่ง
ก็ได้ในหน้าเว็บแนะนำาให้ใส่ OR
28. 4. ค้นหาด้วย “วลี”
ในกรณีที่คุณต้องการค้นหาด้วย
วลี หรือกลุ่มคำา ให้ใส่
เครื่องหมายคำาพูดล้อมรอบ
ข้อความด้วย เช่น “may the
force be with you” Google จะ
ค้นหาเว็บเพจที่มีวลีตามนี้เป๊ะๆ
29. 5. Google จะตัดคำาทั่วไปใน
คีย์เวิร์ด
Google จะตัดเอาคียเวิร์ดที่
์
เป็นอักษรตัวเดียว ตัวเลขตัว
เดียว และคำาทัวๆ ไป อย่างเช่น
่
“to”, “the” และ “how” ออกไป
โดยอัตโนมัติ ซึ่งการตัดคำาเหล่า
นี้ออกไปจะช่วยให้ Google
ค้นหาผลลัพธ์ได้เร็วขึ้น แต่ถ้า
คุณยังต้องการให้ Google ใช้คำา
เหล่านีในการค้นหาก็ให้ใส่
้
30. 6. Google จัดลำาดับผลลัพธ์
อย่างไร
Google ได้สร้างระบบทีเรียก
่
ว่า Page Rank ซึ่งทำาหน้าทีจัด
่
อันดับผลลัพธ์ทได้จากการค้นหา
ี่
Page Rank เริ่มต้นทำางานด้วย
การนับจำานวนลิงค์ของเว็บไซต์
ต่างๆ ทีลิงค์เข้าไปยังแต่ละ
่
เว็บไซต์ผลลัพธ์ โดยตัวเลขนี้จะ
ถูกใช้แทนคะแนนโหวตอย่างไม่
31. 7. Cached Link
ภาษาไทยใช้ว่า “หน้าที่ถูกเก็บ
ไว้”
ขณะที่คณกำาลังใช้ Google นั่น
ุ
หมายความว่า คุณกำาลังค้นหาข้อมูล
ที่ตองการจากอินเด็กซ์หลายพันล้าน
้
เว็บเพจของ Google ซึงทาง่
เว็บไซต์พยายามจะอัพเดตข้อมูลให้
บ่อยทีสุดเท่าที่จะเป็นไปได้ แต่
่
เนื่องจากเว็บเพจมีการอัพเดตตลอด
เวลามันจึงเป็นไปไม่ได้ทจะสามารถ
ี่
ทำาอินเด็กซ์เว็บที่อัพเดตได้ Cached
32. 8. Similar Pages Link
ภาษาไทยใช้ว่า “หน้าที่คล้าย
กัน”
เป็นเครื่องมือวิจัยทีดีมาก และ
่
รวดเร็วมากสำาหรับการค้นหา
เว็บเพจที่มความคล้ายคลึง หรือ
ี
สัมพันธ์กับรายชื่อผลลัพธ์ที่ได้
จากการค้นหา เหมาะที่จะใช้เมื่อ
คุณกำาลังมองหาวิธที่รวดเร็วใน
ี
การสร้างลิงค์มากมายที่
เกี่ยวข้องกับสิ่งทีสนใจ แม้คณจะ
่ ุ
35. 10. ตรวจคำาสะกดผิด
Google จะสร้างลิงก์ที่
สามารถตรวจคำาสะกดให้กับ
คียเวิร์ดที่คนหาโดยอัตโนมัติ
์ ้
และชี้แนะคียเวิร์ดทีถูกต้องให้อีก
์ ่
ด้วย ซึ่งเก่งกว่าที่พบในเวิร์ดมาก
ทีเดียว โดยมันสามารถแก้คำา
นามที่เป็นชื่อเฉพาะ, สถานที่
และคำาอื่นๆ ทีไม่มีโอกาสพบใน
่
ดิกชันนารีได้เหมือนตาเห็น
โดยทั่วไป Google จะแสดง
37. ไฟล์รองรับการค้นหาของ
Google
- Adobe Portable Document Format
(.pdf)
- Adobe Postscript (.ps)
- Lotus 123 formats, Lotus WordPro
(.lwp), MacWrite (.mw)
- Rich Text format (.rtf), Text
(.txt, .ans)
- Microsoft Excel (.xls)
- Microsoft PowerPoint (.ppt)
- Microsoft Word (.doc), Microsoft
38. 12. Google images
(http://images.google.co
m)
Google Image Search
สามารถค้นหาภาพจากทั่วโลก
ได้มากกว่า 425 ล้าน ซึ่งถือว่า
เป็นดัชนีที่มีขนาดใหญ่ทสุดใน
ี่
โลก การค้นหาภาพสามารถ
ทำาได้โดยใช้คียเวิร์ด ส่วน
์
ผลลัพธ์จะส่งกลับมาในรูปของ
รูปย่อขนาด 20 รูป ผู้ใช้สามารถ
39. 13. Google Toolbar (
http://toolbar.google.com
)
Google Toolbar จะเหมาะ
กับผู้ที่ตองใช้งาน
้ Google
มากๆ หลังจากดาวน์โหลด
Toolbar มาติดตังใน
้
คอมพิวเตอร์ มันจะอยูใต้ชุด
่
ปุ่มควบคุม (ถอยหลัง, เดิน
หน้า, หยุด, แอดเดรส) ของ
41. 14. หลากหลายชื่อไซต์ ยังไง
ก็ไม่หลงทาง
แม้ชื่อ Google จะจำาง่าย และ
พิมพ์งายแต่ก็ยงมีผู้พิมพ์ผิด
่ ั
มากมาย ทำาให้ไม่สามารถไป
เว็บไซต์ Google ได้ เพื่อแก้
ปัญหานีทางเว็บไซต์ จึงได้จดโด
้
เมนเนมชื่อ Google ในรูปแบบที่
พิมพ์ผด ไว้ด้วย เช่น
ิ
Googel.com
Gogle.com