a. 備用網(wǎng)頁:在網(wǎng)站中一般是amp頁面,或者在canonical標(biāo)簽中指向了其他的url的頁面,是備用網(wǎng)頁,這些頁面一般不需要驗(yàn)證。
b. 自動重定向:一般是做了301跳轉(zhuǎn)的,目前網(wǎng)站系統(tǒng)中除了手動設(shè)置的301外,還有一些系統(tǒng)默認(rèn)301,比如:產(chǎn)品文章使用系統(tǒng)url后,改了產(chǎn)品或文章的名稱,則url會改變,原先的url會自動跳到新的url上;還有就是后臺設(shè)置了關(guān)鍵詞不大于某個值時不展示,這時候關(guān)鍵詞聚合的url也會自動跳轉(zhuǎn)到首頁。
c. 已被 robots.txt 屏蔽:robots文件中指定disallow開頭的url就是被屏蔽的url,網(wǎng)站中可以訪問robots規(guī)則:http://|https://域名/robots.txt, 默認(rèn)會將/phoenix/admin開頭的url進(jìn)行屏蔽,因?yàn)檫@些都是動態(tài)url,對seo并不友好,不需要收錄。
d. 未找到 (404):url打開直接報404找不到,這種情況一般是因?yàn)榭蛻魟h除了某些頁面,或者是客戶從老系統(tǒng)轉(zhuǎn)過來的,但是url沒有做保留或者保留遺漏,這種最好做301,或者將報404的url進(jìn)行保留到某個頁面、產(chǎn)品、文章上。
e. 軟404:頁面內(nèi)容意義不大,但是返回碼是200;這種情況一般都是頁面基本沒有實(shí)質(zhì)性內(nèi)容,需要豐富頁面內(nèi)容。
f. 已發(fā)現(xiàn) - 尚未編入索引:該頁面已被 Google 抓取但未編入索引。將來可能會或可能不會被索引;無需重新提交此 URL 進(jìn)行抓取。
g. 已抓取 - 尚未編入索引:該網(wǎng)頁已被 Google 找到,但尚未抓取。通常,Google 想要抓取 URL,但預(yù)計這會使網(wǎng)站超載;因此 Google 重新安排了抓取時間。這就是報告中最后一次抓取日期為空的原因。