為了解決新網(wǎng)站不被收錄的問題,我們必須首先知道影響網(wǎng)站不被收錄的因素是什么,從而找到不被收錄問題的具體影響,并解決它!
影響因素的爬蟲爬行:
首先查看爬蟲每天訪問您網(wǎng)站的次數(shù),然后查看一周內(nèi)是否可以包含爬蟲頁面。如果爬網(wǎng)頁面不被收錄,抓取也沒問題,問題就在網(wǎng)頁本身上。如果爬蟲沒有抓取,那一定是抓取的問題。此時,添加一些場外鏈接以吸引爬蟲訪問自己的網(wǎng)站,或提交百度的自動推送、主動推送、網(wǎng)站地圖、移動終端日級收藏等,通知爬蟲您的URL。
當(dāng)然,提交到搜索引擎URL并不意味著它也會被爬網(wǎng)。搜索引擎有一個爬網(wǎng)隊(duì)列,首先要捕獲哪些網(wǎng)頁,然后要捕獲哪些網(wǎng)頁,您的URL排序是高還是低也會影響它是否會被爬網(wǎng) (為了解決這個問題,您需要為內(nèi)部鏈做一些工作,比如每個網(wǎng)址鏈接到網(wǎng)站其他頁面的次數(shù),次數(shù)越多,頁面就越重要,自然爬網(wǎng)的隊(duì)列順序越高。)。
影響因素的問題:
同樣抓住了,也就是說,不被收錄,無疑是網(wǎng)頁本身的問題,網(wǎng)頁的問題必須分開:
網(wǎng)頁打開速度很慢嗎?
網(wǎng)絡(luò)內(nèi)容的質(zhì)量通過了嗎?
網(wǎng)頁爬蟲的整體內(nèi)容是否可識別?
從頁面速度來看,您可以優(yōu)化服務(wù)器的配置和帶寬,程序上代碼執(zhí)行的效率也會影響打開速度。建議如果速度為1秒,則需要優(yōu)化到幾百毫秒。如果必須給出一個值,我的建議是500毫秒 (這是頁面打開速度,而不是服務(wù)器鏈接速度)。
就內(nèi)容質(zhì)量而言,我將在這里給出幾點(diǎn):
對于新網(wǎng)站,應(yīng)在85% 處保證內(nèi)容的原創(chuàng)性;
內(nèi)容的可讀性必須很強(qiáng),說話流暢,不能冗長;
標(biāo)題是什么,寫下內(nèi)容是什么。你不能這樣賣狗肉;
對于字?jǐn)?shù)沒有明確的要求,但是為了更好地幫助你建議大約600 ~ 800,這只是一個參考值;
爬蟲內(nèi)容是否可識別取決于您是否使用了js來加載內(nèi)容,沒有alt的圖片太多,或者alt聲明不合理,以及falsh的使用等,這可以通過百度搜索資源的網(wǎng)站管理員工具進(jìn)行爬網(wǎng)。診斷,查看爬蟲是否獲取所有內(nèi)容。
最后,鏈接的重要性
一開始提到,一個網(wǎng)頁鏈接的次數(shù)越多,搜索引擎就越認(rèn)為它很重要,并且一定的百分比會增加被包含的可能性。這里我們必須從兩點(diǎn)開始。
1.當(dāng)前網(wǎng)頁的鏈接數(shù)量。
你希望這個網(wǎng)頁包含多少次,鏈接到這個網(wǎng)頁的頁面已經(jīng)包含了嗎?排名?如果它沒有被包括在內(nèi)或排名,你如何看待搜索引擎知道這個頁面的鏈接是給你的?
2.鏈接到您的網(wǎng)頁的重要性
其他人的主頁給你一個鏈接,其他人的內(nèi)頁給你一個鏈接。重要性完全不同。但是不可能有這么多重要的網(wǎng)頁給你一個內(nèi)部頁面的鏈接。因此,我們此時需要做的是通過交換友好鏈接來增強(qiáng)我們主頁和其他網(wǎng)頁的重要性,從而合理地部署內(nèi)部鏈結(jié)構(gòu),從而增加重要鏈接的數(shù)量。
重要而多的鏈接指向你,內(nèi)容沒有問題,爬蟲也抓住了,速度也很快,爬蟲也可以識別你的內(nèi)容。如果你不包括它,你需要通過百度搜索資源平臺從網(wǎng)站管理員那里反饋情況。因?yàn)橛袝r各種搜索引擎中會出現(xiàn)錯誤,這是我個人經(jīng)歷過的事情。
如上所述,我對超過一個月不被收錄在新網(wǎng)站中的問題的回答。希望對您有所幫助!