Press "Enter" to skip to content

Karen Spärck Jones ผู้คิดค้นอัลกอริทึม Search Engine ของโลก

Karen Spärck Jones (คาเรน สปาร์ค โจนส์) ซึ่งเสียชีวิตในวันนี้เมื่อปี 2007 สำหรับเธอแล้ว ถือว่าเป็นผู้คิดค้นอัลกอริทึม Search Engine ในโลกนี้เลยก็ว่าได้ โดยเธอใช้แนวคิดอย่าง IDF (Inverse Document Frequency) ซึ่งเป็นการดึงข้อมูลทำให้มีผลต่อการทำ SEO (Search Engine Optimization) ในทุกวันนี้

IDF และตัวแปรต่างๆ นั้นเป็นพื้นฐานของอัลกอริทึม Search Engine ในโลกนี้ ไม่ว่าจะเป็น Google, Bing หรือ Duck Duck Go ต่างก็ใช้แนวคิดนี้มาพัฒนาอัลกอริทึมของตัวเอง โดยผู้ใช้แนวคิด IDF เป็นเจ้าแรกก็คือ AltaVista ซึ่งโดน Yahoo! ซื้อกิจการไปตั้งแต่ปี 2003 และปิดตัวลงในวันที่ 8 กรกฎาคม 2013

Karen Spärck Jones เป็นนักวิทยาศาสตร์คอมพิวเตอร์ชาวอังกฤษและเป็นผู้บุกเบิกสาขาสารสนเทศศาสตร์ในช่วงสงครามโลกครั้งที่สอง เธอเปรียบเสมือนบุคคลสำคัญของโลกในทุกวันนี้เลยทีเดียว เพราะสิ่งที่เธอได้คิดค้นไว้นั้นเป็นส่วนประกอบหลักของ Search Engine ในปัจจุบัน ถึงแม้ว่า Search Engine แต่ละแห่งนั้นจะมีการปรับเปลี่ยนอัลกอริทึมในการจัดอันดับการค้นหาให้เป็นของตนเอง เพื่อให้ผู้ใช้นั้นสามารถค้นหาด้วยภาษาที่เป็นธรรมชาติ

แนวคิด IDF คือสิ่งที่เรียบง่ายและเป็นธรรมชาติ นั่นคือ ความผกผันของคำค้นหาทำให้ได้รับข้อมูลจำเพาะเจาะจง และการใช้ภาษาธรรมชาติในการค้นหา ต้องมีค่า TF (Term Frequency) ซึ่งเป็นค่าความถี่ในการวัดความหนาแน่นของคำ และตัดคำไม่สำคัญออกไป เช่น The หรือ A ซึ่งแนวคิด TF-IDF ทาง Google ได้พัฒนาต่อมาเป็นค่า PR (PageRank) แต่มีความซับซ้อนมากขึ้น โดยอัลกอริทึมอย่าง RankBrain ที่ใช้เป็นเครื่องมือจัดอันดับการค้นหาโดย AI จะช่วยจัดอันดับหน้าเว็บไซต์สำหรับคำค้นที่แปลกใหม่ รวมถึงกรณีที่คำค้นเป็นข่าวสารต่างๆ ก็จะถูกคำนวนเพื่อนการจัดอันดับตลอดเวลา

Karen Spärck Jones เริ่มทำงานที่ห้องปฏิบัติการคอมพิวเตอร์ มหาวิทยาลัยเคมบริดจ์ ตั้งแต่ปี 1974 และเกษียณเมื่อ 30 กันยายน 2002 หลังจากเข้ารับการรักษาโรคมะเร็ง ในตำแหน่งศาสตราจารย์ด้านคอมพิวเตอร์และสารสนเทศ และเธอยังคงมาทำงานที่ห้องปฏิบัติการคอมพิวเตอร์อยู่เป็นประจำ เธอเสียชีวิตเมื่อวันที่ 4 เมษายน 2007 ที่ Willingham ใน Cambridgeshire (71 ปี)

งานวิจัยหลักที่เธอทำนั่นก็คือการประมวลผลภาษาธรรมชาติและการค้นคืนสารสนเทศ (การได้รับสิ่งที่ต้องการกลับคืนมา) หลักการสำคัญของการค้นคืนสารสนเทศ คือ การค้นหาและนำสารสนเทศที่ตรงตามความต้องการ ส่งให้แก่ผู้ใช้อย่างรวดเร็ว และหนึ่งในผลงานที่สำคัญที่สุดของเธอก็คือแนวคิดเรื่องการถ่วงน้ำหนักในการดึงข้อมูลแบบ IDF ในการค้นคืนสารสนเทศ ซึ่ง IDF นี้ใช้กันแพร่หลายใน Search Engine ส่วนใหญ่ในปัจจุบัน โดยมากเป็นส่วนหนึ่งของการถ่วงน้ำหนักแบบ TF-IDF (Term Frequency–Inverse Document Frequency)