全國服務熱線:400-080-4418
字號:大中小(上海網絡優化)
互聯網發展的今天,一方面離不開其開放、共享的特性帶給人們的全新體驗,另一方面也離不開數以億計的為其提供各類豐富內容的網絡節點。互聯網被普及前,人們查閱資料第一想到的便是擁有大量書籍資料的圖書館,到了今天你怎么想?或許今天的很多人都會選擇一種更方便、快捷、全面、準確的方式——互聯網。你可以坐在家里輕點幾下鼠標就查到想要的各類信息,這在互聯網沒有被普及之前,還都僅是一個夢而已,但如今這一切已成為了現實。(上海企業網站建設)
而幫助你通過整個互聯網快速查找到目標信息的就是越來越被重視的搜索引擎。有關搜索引擎的技術資料網絡上已經很多,關于搜索引擎經濟的多方面報道各大媒體也都已經鋪天蓋地。下面談一些我對搜索引擎的理解:
搜索引擎技術和分類(企業網站建設)
搜索引擎的技術基礎是全文檢索技術,從20世紀60年代,國外對全文檢索技術就開始有研究。全文檢索通常指文本全文檢索,包括信息的存儲、組織、表現、查詢、存取等各個方面,其核心為文本信息的索引和檢索,一般用于企事業單位。隨著互聯網信息的發展,搜索引擎在全文檢索技術上逐漸發展起來,并得到廣泛的應用,但搜索引擎還是不同于全文檢索。搜索引擎和常規意義上的全文檢索主要區別有以下幾點:
1. 數據量(上海網站推廣)
傳統全文檢索系統面向的是企業本身的數據或者和企業相關的數據,一般索引庫規模多在GB級,數據量大的也只有幾百萬條;但互聯網網頁搜索需要處理幾十億的網頁,搜索引擎的策略都是采用服務器群集和分布式計算技術。
2. 內容相關性
信息太多,查準和排序就特別重要,Google等搜索引擎采用網頁鏈接分析技術,根據互聯網上網頁被鏈接次數作為重要性評判的依據;但全文檢索的數據源中相互鏈接的程度并不高,不能作為判別重要性的依據,只能基于內容的相關性排序。
3. 安全性(上海網站建設)
互聯網搜索引擎的數據來源都是互聯網上公開的信息,而且除了文本正文以外,其它信息都不太重要;但企業全文檢索的數據源都是企業內部的信息,有等級、權限等限制,對查詢方式也有更嚴格的要求,因此其數據一般會安全和集中地存放在數據倉庫中以保證數據安全和管理的要求。
4. 個性化和智能化
搜索引擎面向的是互聯網訪問者,由于其數據量和客戶數量的限制,自然語言處理技術、知識檢索、知識挖掘等計算密集的智能計算技術很難應用,這也是目前搜索引擎技術努力的方向;而全文檢索數據量小,檢索需求明確,客戶量少,在智能化和個性可走得更遠。(上海做網站)
Copyright 2008 © 上海網至普信息科技有限公司 All rights reserved. 滬ICP備11006570號-13 滬公網安備 31011402007386號