)
【學習目標】
1、了解網際網路信息檢索工具的類型與特點。
2、掌握搜索引擎產生背景、工作原理與發展趨勢。
3.2網際網路上的信息檢索
一、網際網路信息檢索的方法
在網際網路中信息檢索的方法主要有三種:
1、基於超文本/超媒體的信息瀏覽
從一個超文本/超媒體文檔入手,沿著嵌入其中的、用戶感興趣的超連結去搜索信息。
2、基於目錄服務的信息查詢
3、基於搜索引擎的信息檢索
二、搜索引擎的發展與分類
1、搜索引擎的產生
搜索引擎指網際網路信息查找所使用的軟體工具。最早的搜索引擎出現於1994年,是史丹福大學的兩名博士生:美籍華人楊致遠和美國人David Filo共同創辦的超級目錄索引雅虎(Yahoo)。
2、搜索引擎的分類
類型 搜索方法 代表網站 特點
目錄類
搜索引擎 按目錄檢索 雅虎 http://cn.yahoo.com
搜狐 http://www.sohu.com
新浪 http://www.sina.com.cn
網易 http://www.163.com 以人工或半自動化方式收集信息,由編輯人員查看信息後,人工形成信息摘要,並將信息置於事先確定的分類框架中。
全文
搜索引擎 按關鍵詞檢索 百度 http://www.baidu.com
谷歌 http://www.google.com 從網際網路上「抓取」網頁→建立索引資料庫→用戶查詢時在索引資料庫中搜索排序→響應用戶查詢
元搜索引擎 通過一個統一的用戶界面幫助用戶在多個搜索引擎中選擇和利用合適的(甚至是同時利用若干個)搜索引擎來實現檢索操作。 覓搜http://www.metasoo.com 沒有自己的資料庫,將用戶查詢請求同時向多個搜索引擎遞交,將返回結果進行重新排除、重新排序等處理,把綜合結果返回給用戶。
四、搜索引擎技術的發展
(1)提高搜索引擎對用戶檢索提問的理解。
(2)對檢索結果進行進一步的處理。
(3)確定搜索引擎信息收集範圍、提高搜索引擎的針對性。
如很多搜索引擎都提供了:圖片搜索、MP3搜索、音樂搜索、地圖搜索等。