“萬(wàn)能”的搜索引擎
優(yōu)采云 發(fā)布時(shí)間: 2022-06-05 15:13“萬(wàn)能”的搜索引擎
每當我們需要查什么資料或者新聞的時(shí)候,都會(huì )打開(kāi)搜索引擎,輸入詞組就可以直接搜出自己想要的內容。搜索引擎不但能搜索出海量?jì)热?,而且搜索速度很快?/p>
問(wèn):搜索引擎到底是怎么工作的呢?
這就要從兩個(gè)方面單獨來(lái)分析,一方面是為什么搜索引擎的速度這么快,另一個(gè)方面就是搜索引擎是怎么搜到這么多海量資源的。
書(shū)籍自古以來(lái)都是人類(lèi)進(jìn)步和文明的重要標志之一,因為書(shū)籍可以不受時(shí)間、空間的限制,流傳和保存信息。在沒(méi)有網(wǎng)絡(luò )以前,書(shū)籍是我們獲取信息的主要工具。隨著(zhù)網(wǎng)絡(luò )的普及,我們越來(lái)越多地通過(guò)網(wǎng)絡(luò )搜索信息,網(wǎng)絡(luò )成了獲取信息的主要渠道。截止到2012年4月,互聯(lián)網(wǎng)上被收錄的網(wǎng)頁(yè)已有五百多億個(gè)。如果按照一本書(shū)有500頁(yè)來(lái)估算,這就相當于一億冊圖書(shū)的信息量。
當我們在網(wǎng)上搜索一個(gè)詞語(yǔ)時(shí),搜索引擎會(huì )快速給我們展示結果。例如,我們在百度上搜索雞蛋一次,百度搜索結果有幾千萬(wàn)個(gè)。搜索引擎的服務(wù)器是怎么工作的?為什么能在一瞬間搜索出這么多結果?搜索引擎是逐個(gè)打開(kāi)檢索的網(wǎng)頁(yè)嗎?就算搜索引擎的服務(wù)器1秒鐘能夠打開(kāi)并檢索1萬(wàn)個(gè)網(wǎng)頁(yè),這五百億的網(wǎng)頁(yè)就需要檢索將近兩個(gè)月。我們?yōu)榱说玫揭粋€(gè)信息居然要等兩個(gè)月,這顯然不是搜索引擎服務(wù)器的工作方式。
服務(wù)器能夠快速得出結果,是因為它利用了“關(guān)鍵詞索引”。服務(wù)器會(huì )將所有網(wǎng)頁(yè)掃描一遍,然后為網(wǎng)頁(yè)中的每個(gè)詞語(yǔ)都建立一個(gè)跟這個(gè)詞語(yǔ)有關(guān)的關(guān)鍵詞索引。如果一個(gè)詞組在這個(gè)網(wǎng)頁(yè)中多次出現,那就建立同一個(gè)關(guān)鍵字的多個(gè)索引,這就形成了關(guān)鍵字索引表。這個(gè)關(guān)鍵字索引表可以查到包含這個(gè)關(guān)鍵字的網(wǎng)頁(yè)和位置。因為詞組數量有限,其數目要遠遠小于網(wǎng)頁(yè)數量。只要找到關(guān)鍵字的索引表之后,搜索引擎就能將對應的網(wǎng)頁(yè)內容顯示出來(lái)。
人們越來(lái)越依賴(lài)網(wǎng)絡(luò ),所以就把越來(lái)越多的內容放在互聯(lián)網(wǎng)上。據估計,互聯(lián)網(wǎng)上有數萬(wàn)億的獨立Web頁(yè)面,人們利用搜索引擎從互聯(lián)網(wǎng)上獲取信息內容。我們知道了搜索引擎利用關(guān)鍵字索引表,而關(guān)鍵字索引表又是用關(guān)鍵字索引建立的,關(guān)鍵字索引則是服務(wù)器掃描網(wǎng)頁(yè)時(shí)檢索出關(guān)鍵字設立的。
那么搜索引擎是怎么自動(dòng)完成這些工作的?
搜索引擎的工作一般分三步完成:
1信息抓取
搜索引擎用被稱(chēng)為“網(wǎng)絡(luò )爬蟲(chóng)”的程序來(lái)抓取網(wǎng)頁(yè)上的所有鏈接。因為互聯(lián)網(wǎng)上的網(wǎng)頁(yè)存在互通性,大多數網(wǎng)頁(yè)都可以通過(guò)其他頁(yè)面的鏈接訪(fǎng)問(wèn),網(wǎng)絡(luò )爬蟲(chóng)就通過(guò)一個(gè)點(diǎn)爬遍大多數互聯(lián)網(wǎng)網(wǎng)頁(yè)。
2建立索引
搜索引擎從網(wǎng)頁(yè)頁(yè)面中提取關(guān)鍵字,并把整個(gè)頁(yè)面信息內容按照一定的規則保存到自己的數據庫里。
3結果顯示
因為服務(wù)器早已經(jīng)建立好了關(guān)鍵字索引,并把信息保存到了自己的數據庫,所以當我們搜索某個(gè)詞組時(shí),服務(wù)器只需要檢索自己的數據庫就可以了。
萬(wàn)能的搜索引擎像一個(gè)優(yōu)秀的魔術(shù)師,讓苦于解開(kāi)某個(gè)難題的我們瞬間找到了解鎖答案的鑰匙。相信隨著(zhù)科技的進(jìn)步,搜索引擎能為我們提供更為便捷的信息檢索。