全國服務熱線:400-080-4418
搜索引擎經過幾年的發展和摸索,越來越貼近人們的需求,搜索引擎的技術也得到了很大的發展。搜索引擎的新技術發展包括以下幾個方面:
一、提高搜索引擎對用戶檢索提問的理解
為了提高搜索引擎對用戶檢索提問的理解,就必須有一個好的檢索提問語言,為了克服關鍵詞檢索和目錄查詢的缺點,現在已經出現了自然語言智能答詢。用戶可以輸入簡單的疑問句,比如“how can kill virus of computer?”。搜索引擎在對提問進行結構和內容的分析之后,或直接給出提問的答案,或引導用戶從幾個可選擇的問題中進行再選擇。自然語言的優勢在于,一是使網絡交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來講,如果用關鍵詞查詢,多半人會用“virus”這個詞來檢索,結果中必然會包括各類病毒的介紹、病毒是怎樣產生的等等許多無效信息,而用“how can kill virus of computer?”,搜索引擎會將怎樣殺病毒的信息提供給用戶,提高了檢索效率。
二、對檢索結果進行處理
1、基于鏈接評價的搜索引擎
基于鏈接評價的搜索引擎的優秀代表是Google,它獨創的“鏈接評價體系”是基于這樣一種認識,一個網頁的重要性取決于它被其它網頁鏈接的數量,特別是一些已經被認定是“重要”的網頁的鏈接數量。這種評價體制與《科技引文索引》的思路非常相似,但是由于互聯網是在一個商業化的環境中發展起來的,一個網站的被鏈接數量還與它的商業推廣有著密切的聯系,因此這種評價體制在某種程度上缺乏客觀性。
2、基于訪問大眾性的搜索引擎
基于訪問大眾性的搜索引擎的代表是direct hit,它的基本理念是多數人選擇訪問的網站就是重要的網站。根據以前成千上萬的網絡用戶在檢索結果中實際所挑選并訪問的網站和他們在這些網站上花費的時間來統計確定有關網站的重要性排名,并以此來確定哪些網站符合用戶的檢索要求。因此具有典型的趨眾性特點。這種評價體制與基于鏈接評價的搜索引擎有著同樣的缺點。
3、去掉檢索結果中附加的多余信息
有調查指出,過多的附加信息加重了用戶的信息負擔,為了去掉這些過多的附加信息,可以采用用戶定制、內容過濾等檢索技術。
三、確定搜索引擎信息搜集范圍,提高搜索引擎的針對性
1、垂直主題搜索引擎
網上的信息浩如煙海,網絡資源以十倍速的增長,一個搜索引擎很難收集全所有主題的網絡信息,即使信息主題收集得比較全面,由于主題范圍太寬,很難將各主題都做得精確而又專業,使得檢索結果垃圾太多。這樣以來,垂直主題的搜索引擎以其高度的目標化和專業化在各類搜索引擎中占據了一系席之地,比如象股票、天氣、新聞等類的搜索引擎,具有很高的針對性,用戶對查詢結果的滿意度較高。作者認為,垂直主題有著極大的發展空間。
2、非www信息的搜索
提供FTP等類信息的檢索
3、多媒體搜索引擎
多媒體檢索主要包括聲音、圖像、視頻的檢索。關于圖片搜索引擎的原理,《淺談圖片搜索引擎的實現》中提出了具有跨時代意義設計思路。
四、將搜索引擎的技術開發重點放在對檢索結果的處理上,提供更優化的檢索結果
1、純凈搜索引擎
這類搜索引擎沒有自己的信息采集系統,利用別人現有的索引數據庫,主要關注檢索的理念、技術和機制等。
2、元搜索引擎
現在出現了許多的搜索引擎,其收集信息的范圍、搜索機制、算法等都不同,用戶不得不去學習多個搜索引擎的用法。每個搜索引擎平均只能涉及到整個www資源的30-50%(search engine watch數據),這樣導致同一個搜索請求在不同搜索引擎中獲得的查詢結果的重復率不足34%,而每一個搜索引擎的查準率不到45%。
元搜索引擎(metasearch enging)是將用戶提交的檢索請求到多個獨立的搜索引擎上去搜索,并將檢索結果集中統一處理,以統一的格式提供給用戶,因此有搜索引擎之上的搜索引擎之稱。它的主要精力放在提高搜索速度、智能化處理搜索結果、個性搜索功能的設置和用戶檢索界面的友好性上,查全率和查準率都比較高。目前比較成功的元搜索引擎有metacrawler、dopile、ixquick、搜客等。[Page]
3、集成搜索引擎
集成搜索引擎(All-in-One Search Page),亦稱為“多引擎同步檢索系統”是在一個WWW頁面上鏈接若干種獨立的搜索引擎,檢索時需點選或指定搜索引擎,一次檢索輸入,多引擎同時搜索,用起來相當方便。
集成搜索引擎無自建數據庫,不需研發支持技術,當然也不能控制和優化檢索結果。但集成搜索引擎制作與維護技術簡單,可隨時對所鏈接的搜索引擎進行增刪調整和及時更新,尤其大規模專業(如FLASH、MP3等)搜索引擎集成鏈接,深受特定用戶群歡迎。
4、垂直搜索引擎
垂直搜索引擎是相對通用搜索引擎的信息量大、查詢不準確、深度不夠等提出來的新的搜索引擎服務模式,通過針對某一特定領域、某一特定人群或某一特定需求提供的有一定價值的信息和相關服務。其特點就是“專、精、深”,且具有行業色彩,相比較通用搜索引擎的海量信息無序化,垂直搜索引擎則顯得更加專注、具體和深入。
五、搜索引擎的分類
網頁音樂(翻唱MP3)影視(電影電視)視頻播客軟件BT下載硬件圖片壁紙相冊小說文學文檔(論文述職報告思想匯報演講稿入黨申請書作文個人簡歷畢業論文法律論文經濟論文教育論文會計論文計算機論文畢業論文集情書調查報告求職信商業計劃書實習報告就職演說自薦信企劃方案企業管理年終總結)新聞(資訊)百科(知識經驗)教育人物學校專業論壇社區博客詞典翻譯地圖動漫Flash游戲娛樂笑話汽車家電手機廣告購物商業黃頁房產招聘財經股票基金法律國學圖書政府目錄學術代碼公交實用查詢等幾十個分類。
六、搜索引擎的后一步
10年前我們要查閱資料,請教問題,更多想到的是請教專家,圖書管查閱等傳統方式。常常為了一個簡單的問題而到處尋師,在圖書館翻著類似我的電腦桌抽屜里的檢索卡片,苦苦尋找。曾幾何時,互聯網的普及與興起,搜索引擎的出現,逐漸改變著我們的生活習慣和思維方式。很多問題“baidu一下,你就知道。”就像這里用的“曾幾何時”這一詞,中文不好的我只有模糊的理解,還以為有“曾經”的意思,想用為第一句。于是百度知道搜索了一下,出自宋"王安石《祭盛侍郎文》:“補官揚州,公得謝歸。曾幾何時,訃者來門。”才知是才過了不久的意思。
搜索引擎是一個系統,能從大量信息中找到所需的信息,提供給用戶。互聯網出現到現今,信息量可以說成密指數的增長,大量信息就像Google的原本含義一樣“1的后面跟著100個0”,這個數比宇宙所有的基本粒子的數量總和還要大。在這浩如煙海的信息中怎么才能找到自己需要的信息呢?搜索引擎就像一只神奇的手,從雜亂的信息中抽出一條清晰的檢索路徑。
事物的發展往往遵循著合久必分,分久必合的規律,每一次的合與分都是代表著更高級更先進。同樣搜索引擎從初的Archie可以用文件名查找整個互聯網中FTP文件的系統,發展到Yahoo早期一種手工錄入的分行業的目錄檢索。隨著搜索技術的發展,元標記搜索、全文搜索重新又把整個互連網的信息整合起來提供給用戶,目前的Baidu、Google提供的就是一種整個互聯網的全文搜索,這種整合信息的搜索也稱為水平搜索。這種水平全文搜索固然可以把網絡中的所有相關信息提供給用,但這種“所有”不代表著是用戶所需的“所有”,往往夾雜著許多垃圾信息。問題出現就伴隨著去解決,如果平常使用搜索引擎比較全面,你會發現Baidu、Goolge都有了“更多”的選項,其中出現了大學搜索、新聞搜索、圖書搜索、圖片搜索等等這些專業化,行業化的搜索,也稱為垂直搜索。當前垂直搜索正在逐漸走向豐富化、專業化、行業化,將越來越滿足人們的搜索需求。比如很多人在搜索問題時會到百度知道里搜索,因為那里更有針對性;搜索天氣會到天氣搜索中等等。
那么搜索引擎的下一步發展是什么呢?讓我們回想一下搜索引擎的定義:一個系統,能從大量信息中找到所需的信息,提供給用戶。根據技術的不斷發展和事物規律暢想一下,垂直搜索發展到一定程度會出現信息的單一專業化太強,整體信息綜合化不好,而人們需要的不但要有專業信息,同樣也要有整體聯想信息。隨著人工智能、神經網絡、網格計算等搜索技術的發展,我們又將有一個能整合互聯網信息,智能的提供用戶確實所“需”的信息,而不簡單只是所“要”的信息,因為很多時候搜索時,自己都不知道要什么。[Page]
再回的現在的搜索引擎,它就像一只神奇的手,從雜亂的信息中抽出一條清晰的檢索路徑。這個引擎提供給用戶的后一步是什么?是一條清晰的檢索路徑。好的,注意這是一條檢索路徑,在這條路徑的上的檢索和信息提取是什么呢,是我們的閱讀和大腦的判斷。也就是做搜索引擎的后一步是我們的大腦。得到的這條路徑清晰但也并不簡短,需要我們進行快速的瀏覽,呵呵,繞來繞去,得出一個結論,快速閱讀也是搜索引擎中的一部分。
隨著搜索市場競爭的白熱化,搜索引擎不僅開始深挖自己的戰壕,還開始打起了口水戰,而山寨搜索引擎在高舉著“整合”的大旗,開始大搖大擺地進入這個本來只有巨頭壟斷的市場。國人充分發揮著其無比的想象力,準備讓國內的互聯網“步入搜索新時代”。
Copyright 2008 © 上海網至普信息科技有限公司 All rights reserved. 滬ICP備11006570號-13 滬公網安備 31011402007386號