除了HTML文件外,搜索引擎通常還能抓取和索引以文字為基礎的多種文件類型,如PDF、WORD、WPS、XLS、PPT、TXT文件等。我們在搜索結果中也經常會看到這些文件類型。但目前的搜索引擎還不能處理圖片和視頻,對FLASH這類非文字內容,以及腳本和程序只能進行有限的處理。
雖然 搜索引擎在識別圖片及從FLASH中提取文字內容方面有些進步,不過距離直接靠讀圖片、視頻、FLASH內容返回結果的目標還很遠。對圖片、視頻內容的排名還往往是依據與之相關的文字內容。
除了HTML文件外,搜索引擎通常還能抓取和索引以文字為基礎的多種文件類型,如PDF、WORD、WPS、XLS、PPT、TXT文件等。我們在搜索結果中也經常會看到這些文件類型。但目前的搜索引擎還不能處理圖片和視頻,對FLASH這類非文字內容,以及腳本和程序只能進行有限的處理。
雖然 搜索引擎在識別圖片及從FLASH中提取文字內容方面有些進步,不過距離直接靠讀圖片、視頻、FLASH內容返回結果的目標還很遠。對圖片、視頻內容的排名還往往是依據與之相關的文字內容。