搜索引擎的基本工作原理包括:互聯(lián)網(wǎng)中發(fā)現(xiàn)、搜集網(wǎng)頁信息;同時對信息進行提取和組織建立索引庫;再由檢索器根據(jù)用戶輸入的查詢關(guān)鍵字,在索引庫中快速檢出文檔,進行文檔與查詢的相關(guān)度評價,對將要輸出的結(jié)果進行排序,并將查詢結(jié)果返回給用戶。
1、爬行,搜索引擎就是通過特定規(guī)則的軟件來跟蹤網(wǎng)頁鏈接,從一個鏈接爬到另一個。
2、抓取存儲,搜索引擎就是爬蟲搜索網(wǎng)頁,找到網(wǎng)頁中的其他鏈接地址,然后根據(jù)這些鏈接地址搜索下一頁,直到抓取完該網(wǎng)站的所有網(wǎng)頁。若將整個因特網(wǎng)看作一個網(wǎng)站,則網(wǎng)絡(luò)蜘蛛可以利用這一原理抓取因特網(wǎng)上所有的網(wǎng)頁,被抓取的網(wǎng)頁稱為網(wǎng)頁快照。
3、數(shù)據(jù)庫處理,將抓取到的網(wǎng)頁放到數(shù)據(jù)庫中。
4、排名,用戶在搜索框中輸入關(guān)鍵字后,排名程序調(diào)用索引庫數(shù)據(jù),計算排名顯示給用戶,排名過程直接與用戶交互。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!