在我們的網(wǎng)站制作完成后,需要提交到不同的搜索引擎去收錄自己的站,以好有個排名,按照不同的技術(shù)特點,可以把搜索引擎分為網(wǎng)頁級搜索、垂直搜索、元搜索引擎、目錄搜索和集成搜索等五類。
一、網(wǎng)頁級搜索
網(wǎng)頁級搜索引擎是名副其實的搜索引擎,國外具代表性的有Google、Yahoo、MSN Live Search、Ask,國內(nèi)著名的有百度、搜狗等。它們都是通過從互聯(lián)網(wǎng)上提取的各個網(wǎng)站的信息(以網(wǎng)頁文字為主)而建立的數(shù)據(jù)庫,檢索與用戶查詢條件匹配的相關(guān)記錄,然后按一定的排列順序?qū)⒔Y(jié)果返回給用戶。網(wǎng)頁級搜索引擎也是目前常規(guī)意義上的搜索引擎。
二、垂直搜索
垂直搜索是針對某一個行業(yè)的專業(yè)搜索引擎,是搜索引擎的細分和延伸。它將網(wǎng)頁庫中某類專門的信息進行一次整合,定向分字段抽取出需要的數(shù)據(jù)進行處理,然后再以某種形式返回給用戶。
垂直搜索引擎與普通網(wǎng)頁搜索引擎的最大區(qū)別是對網(wǎng)頁信息進行了結(jié)構(gòu)化抽取,也就是將網(wǎng)頁的非結(jié)構(gòu)化數(shù)據(jù)抽取成特定的結(jié)構(gòu)化信息數(shù)據(jù),然后將這些數(shù)據(jù)存儲到數(shù)據(jù)庫,進行進一步的加工處理,如:去重、分類等,最后分詞、索引,再以搜索的方式滿足用戶的需求。可以這樣說,網(wǎng)頁搜索是以網(wǎng)頁為最小單位,基于視覺的網(wǎng)頁塊分析是以網(wǎng)頁塊為最小單位,而垂直搜索是以結(jié)構(gòu)化數(shù)據(jù)為最小單位。
各大搜索引擎都有自身的垂直搜索功能,比如MP3搜索、圖片搜索、新聞搜索、Blog搜索等。獨立的垂直搜索網(wǎng)站也受到有相關(guān)興趣的用戶的青睞,比如旅游搜索引擎、商業(yè)搜索引擎、比價搜索引擎等。
三、元搜索引擎
元搜索引擎在接受用戶查詢請求時,同時在其它多個引擎上進行搜索,并將結(jié)果返回給用戶。元搜索引擎并不直接抓取網(wǎng)頁,而是抓取多個搜索引擎的索引數(shù)據(jù)庫,并根據(jù)自己的算法對抓取結(jié)果重新篩選排序。
雖然說元搜索引擎綜合了多個搜索引擎的結(jié)果,但由于是建立在其他搜索引擎基礎(chǔ)之上,自身的排序算法也難以得到認可,所以一直沒有特別的影響力。
比較知名的元搜索引擎有Dogpile(www.dogpile.com)、Vivisimo(www.vivisimo.com)、比比貓(www.bbmao.com)等。
四、目錄搜索
目錄索引雖然有搜索功能,但在嚴格意義上算不上是真正的搜索引擎,僅僅是按目錄分類的網(wǎng)站鏈接列表,并提供站內(nèi)搜索而已。用戶完全可以不用進行關(guān)鍵詞查詢,僅靠分類目錄也可找到需要的信息。Yahoo和搜狐都提供分類目錄功能,其它知名的目錄還有DMOZ(www.dmoz.org)、
五、集成搜索
集成搜索算不上是搜索引擎,只是運用了一定的網(wǎng)頁技術(shù),把多個搜索引擎的搜索功能整合在一個搜索頁面,并對各個搜索引擎的功能進行分類,方便用戶在多個搜索引擎的搜索結(jié)果中進行比較和選擇。部分集成搜索甚至沒有對用戶的搜索請求做出任何記錄。所以,集成搜索更像一個在線的、集合了多個搜索引擎入口的軟件,而不是搜索引擎。
查看更多的教程,點擊海源川匯主站 http://www.mallcai.com