วันจันทร์ที่ 11 กุมภาพันธ์ พ.ศ. 2556

ความหมาย ประเภท ลักษณะการทำงานของ Search engine

Search Engine
ความหมายของSearch Engine

Search Engine คือ เครื่องมือการค้นหาข้อมูลผ่านอินเตอร์เน็ต ที่ทุกคนสามารถหาข้อมูลผ่านอินเตอร์เน็ตก็ได้ โดยกรอกข้อมูลที่ต้องการค้นหา หรือ Keyword (คีย์เวิร์ด) เข้าไปที่ช่อง Search Box แล้วกด Enter ข้อมูลที่เราค้นหาก็จะถูกแสดงออกมาอย่างมากมาย เพื่อให้เราเลือกข้อมูลตรงกับความต้องการของเรามากที่สุด โดยลักษณะการแสดงผลของ Search Engine นั้นจะทำการแสดงผลแบบ เรียงอันดับ Search Results ผ่านหน้าจอคอมพิวเตอร์ 


ประเภทของSearch Engine

Search Engine มี3ประเภท (ในวันที่ทำการศึกษาข้อมูลนี้และได้ทำการรวบรวมข้อมูล สรุปได้3 ประเภทหลัก) โดยมีหลักการทำงานที่ต่างกัน และ การจัดอันดับการค้นหาข้อมูลก็ต่างกันด้วย  เพราะมีลักษณะการทำงานที่ต่างกันนี่เองทำให้ โดยทั่ว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่ที่พอสรุปได้ก็มีเพียง3 ประเภทหลัก ๆ ดังที่จะนำเสนอต่อไปนี้


ประเภทที่ 1 Crawler Based Search Engines

Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน

โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ
1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำหน้าที่ในการตรวจหา และ ทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots
ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com


 ประเภทที่ 2 Web Directory หรือ Blog Directory

    Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งจะขอยกตัวอย่างดังนี้



    ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory

    1. ODP หรือ Dmoz ที่หลาย?ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทย 
            (URL : http://www.dmoz.org )



    2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย                                             

          (URL : http://webindex.sanook.com )


    3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่างๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้



ประเภทที่ 3 Meta Search Engine

    Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ
    
    ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย?ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.

    มาถึงตอนนี้หลาย ๆ ท่านที่เคยสงสัยว่า “Search Engine คืออะไร” คงได้หายสงสัยกันไปบ้างแล้วและเริ่มเข้าใจหลักการทำงานของ Search Engine กันมากขึ้น เพื่อจะได้เลือกใช้อย่างถูกต้องและตรงกับความต้องการของเราในการค้นหาข่าวสารข้อมูล สำหรับบทความ “Search Engine คืออะไร” นี้หากขาดตกบกพร่องประการใด หรือ ไม่ได้รับข้อมูลที่ชัดเจนท่านสามารถติชม หรือ ให้ข้อเสนอแนะต่าง ๆ ผ่าน Comments ของบทความชุดนี้เพื่อจะได้ทำการปรับปรุงและแก้ไขให้ได้ข้อมูลที่ดีที่สุดและ เป็นประโยชน์สำหรับ ผู้ที่ทำการค้นคว้างข้อมูลต่าง ๆ เพื่อนำไปใช้งาน



ลักษณะการทำงานของ Search Engine  

ประกอบไปด้วย ๓ ส่วนหลัก ๆ คือ

๑. Spider หรือ Web Robot จะเป็นตัวที่ทำหน้าที่เข้าสำรวจเว็บไซต์ต่างๆ แล้วดึงข้อมูลเหล่านั้นมาอัพเดทใส่ในรายการฐานข้อมูล ส่วนมาก Spider มักจะเข้าไปอัพเดทข้อมูลเป็นรายเดือน

๒. ฐานข้อมูล (Database) เป็นส่วนที่เก็บรายการเว็บไซต์ ฐานข้อมูลที่ดีควรจะมีขนาดใหญ่เพียงพอที่จะรองรับกับการเติบโตของเว็บไซต์ในปัจจุบัน การออกแบบฐานข้อมูลที่ดีก็เป็นส่วนสำคัญเพราะถ้าฐานข้อมูลออกแบบมาทำงานช้าก็ทำให้การรอผลนานและจะไม่ได้รับความนิยมไปในที่สุด

๓.โปรแกรม Search Engine มีหน้าที่รับคำหรือข้อความที่ผู้ใช้งานป้อนเข้ามา แล้วเข้าค้นหาตามเว็บไซต์ต่างๆ ที่จัดเก็บไว้ในฐานข้อมูล จากนั้นก็จะรายงานผลเว็บไซต์ที่ค้นพบให้กับผู้ใช้ การสืบค้นด้วยวิธีนี้นอกจากจะต้องมีระบบการสืบค้นข้อมูลที่รวดเร็วและมีประสิทธิภาพแล้ว การกลั่นกรองผลที่ได้ เพื่อให้ตรงกับความต้องการของผู้ใช้ก็เป็นอีกส่วนหนึ่งที่สำคัญของการสืบค้นข้อมูล

ดังนั้น  การเลือกใช้เครื่องมือในการค้นหาจะต้องเข้าใจว่า ข้อมูลที่ต้องการค้นหานั้นมีลักษณะอย่างไร มีขอบข่ายกว้างขวางหรือแคบขนาดไหน แล้วจึงเลือกใช้เว็บไซต์ค้นหาที่ให้บริการตรงกับความต้องการ


วิธีการทำงานของ Search Engine

โดยทั่วไปเว็บไซต์ Search engines มีกระบวนการทำงาน (Sullivan, 2001) แบ่งออกเป็น 3 ขั้นตอน คือ

ใช้โปรแกรมรวบรวมเอกสารเว็บ (spider หรือ  crawler) สำรวจและอ่านหน้าเว็บจากโดเมนต่างๆ  และหากพบ links ก็จะทำการติดตาม links ภายใน site จนครบ ซึ่งจากการทำงานในลักษณะโยงใยนี้ จึงเป็นที่มาของคำว่า spider หรือ crawler จากนั้น spider จะนำข้อมูลเว็บดังกล่าวไปเก็บไว้ในฐานข้อมูลของ Search Engine และ spider จะกลับไปตรวจสอบข้อมูลในเว็บนั้น ๆ อย่างสม่ำเสมอ เช่น ทุก 1 หรือ 2 เดือน เพื่อสำรวจความเปลี่ยนแปลง
จัดทำรายการดรรชนี  
ข้อมูลที่โปรแกรม spider พบจะถูกทำสำเนาและส่งมาจัดเก็บที่รายการดรรชนี (index  หรือ catalog) ตามบัญชีดรรชนีที่ (มนุษย์) กำหนดไว้
หากข้อมูลที่เว็บต้นฉบับมีการเปลี่ยนแปลงข้อมูลในสมุดดรรชนีจะเปลี่ยนแปลงด้วย  
โปรแกรมสืบค้น (Search engine software)
จะเป็นโปรแกรมส่วนที่ผู้ใช้อินเทอร์เน็ตติดต่อเข้าใช้บริการ
จะทำหน้าที่ในการค้นคืนข้อมูลจากฐานข้อมูลของ search engine
จะเริ่มต้นการทำงานเมื่อผู้ใช้ป้อนคำค้น
โปรแกรมจะนำคำค้นของผู้ใช้ไปจับคู่กับดรรชนีในฐานข้อมูล
แล้วทำการดึงข้อมูล (เอกสารเว็บ) ที่ตรงกับคำค้นออกมา
และจัดลำดับผลการค้นตามระดับความเกี่ยวข้องที่โปรแกรมประเมินได้  
Search engine แต่ละตัวจะใช้ตรรกะที่แตกต่างกันไป
ตัวอย่างการสร้างเกณฑ์ในการกำหนดค่าน้ำหนักให้กับคำดรรชนีของ Search engine อาจจัดลำดับ  ดังนี้ (Bradley, 2002) 
1. จะให้ค่าน้ำหนักความเกี่ยวข้องกับคำค้นมากที่สุด (ตามที่มนุษย์ได้ตั้งค่าโปรแกรมไว้)
2. คำ หรือวลี ที่ปรากฏใน Meta tag elements (เป็นส่วนหนึ่งของการเขียนเอกสาร html)
3. คำ หรือวลี ที่ปรากฏใน Title tag (ปรากฏที่บรรทัดแรกของ Title bar)
4. คำ หรือวลี ที่ปรากฏใน Main heading และ Sub heading (ข้อความที่เป็นขนาดใหญ่  ขนาดรอง ในแต่ละ Web page)
5. จำนวนครั้งที่ คำ หรือวลี ปรากฏในส่วนเนื้อหาของเอกสาร
6. ความถี่ที่เว็บอื่นๆ เชื่อมโยงเข้ามา (มีการตรวจสอบโดยใช้โปรแกรม)




 ประโยชน์ของการค้นข้อมูลโดยใช้ search engine

           1. ค้นหาเว็บที่ต้องการได้สะดวก รวดเร็ว
        2. สามารถค้นหาแบบเจาะลึกได้ ไม่ว่าจะเป็น รูปภาพ, ข่าว, MP3 และอื่นๆ อีกมากมาย
        3. สามารถค้นหาจากเว็บไซต์เฉพาะทาง ที่มีการจัดทำไว้ เช่น download.com เว็บไซต์เกี่ยวกับข้อมูลและซอร์ฟแวร์ เป็นต้น 
        4. มีความหลากหลายในการค้นหาข้อมูล
        5. รองรับการค้นหา ภาษาไทย

ที่มา


www.learners.in.th/blogs/posts/179405


home.kku.ac.th/hslib/412141/internet/search52.htm 


www.namonpit.ac.th/krutae/internet1/p4-6.htm


www.sa.ac.th/e-learning/search.../thai-search-engine.ht...



11 ความคิดเห็น:

  1. ความคิดเห็นนี้ถูกผู้เขียนลบ

    ตอบลบ
  2. ความคิดเห็นนี้ถูกผู้เขียนลบ

    ตอบลบ
  3. ความคิดเห็นนี้ถูกผู้เขียนลบ

    ตอบลบ
  4. ความคิดเห็นนี้ถูกผู้เขียนลบ

    ตอบลบ