百度收錄永遠是SEOer們討論的關鍵話題,在搜索引擎網站優化的戰爭中,能夠得到穩定的收錄會直接影響到網站的流量。但很多人疑問:為什么網站的首頁更新的很快,而推廣時就是不收錄內頁,而單單只是收錄首頁一個空売呢?相信也有許多的朋友和我一樣在尋找問題的答案。
本文一起探討網站只收首頁不收內頁的原因分析與解決方法。
1、百度己經收錄了但還示被放出來
百度對文章的收錄也是需要審核時間的,蛛蛛抓取成功的索引內容會錄入到數據庫,這也是需要經過二次的審查是否被判為SPAM然后才放出來并參于排名,具體放出的時間與網站的權重高低有著相對的直接關系,而百度周期更新時才放出收錄較為常見的為新站。
解決對策:我們要做的就是:保證內容定期定量的更新,并進行對網站日志的觀察及分析,只要蛛蛛正常爬行,那么您就可以靜心的等待著,百度會給你一個驚喜。
2、robots設置問題也會導致網站內頁不受到搜索引擎的索引
解決對策:檢查是否語法錯誤屏蔽到了蛛蛛的爬行,其中有包括:meta robots與nofollow等標簽的設置。
3、網站的內部鏈接存在問題
在網絡營銷時比如造成了大量的錯誤鏈接,不良鏈接,蛛蛛爬行的不通暢,或根本無法抓取,那么這些不良的網址也會導致您網站降權。
解決對策:百度針對網站的首頁,頻道等各個重要的頁面進行做錯誤的鏈接檢查,會檢查到留言板,評論版塊,等等網友能互動的功能之不良鏈接,盡量避免不良網站互鏈。
4、網站在推廣的過程中使用了黑帽的手段,百度識別到欺騙手段就會對整站進行降權。
解決對策:不做關鍵詞堆砌,不群發,不做黑鏈等黑帽行為,網站保持穩定,少動歪腦筋,如果一意孤行的做了,那百度一有動作,網站就很難再被挽回了。
5、與文章的原創度相關
頭部標簽的設置會導致頁面類似的重復,或者是采集的頁面太多時,百度數據庫中己存有大量的相似信息而不收錄你,如果是長期的這樣操作會導致百度降權。
解決對策:多些保持文章的原創度(高度偽原創)質量比數量重要,最好是每天都能夠定時定量的更新,這樣百度對你的網站抓取也有了守時的好習慣。
6、服務器訪問情況
如無法訪問,速度緩慢,被掛馬等情況。在百度蜘蛛來抓取內容時,多次識別網站有著大量的錯亂碼或者是遇到了服務器無法訪問,那么網站因由也會被列入觀察名單。
解決對策:做好網站代碼優化,提高頁面的讀取速度,選擇好安全的空間服務商,成熟的網站程序編碼,并定期的更新補丁,定期對修改文件痕跡做好跟蹤。百度只收錄了網站首頁分兩種情況,一種是新網站只被百度收錄了首頁,另一種是網站很長時間了,也是只被百度收錄了首頁而已。針對這兩種情況,應該如何解決呢?
新站點出現這種情況時,要先明確網站到底有多新。假設網站從創建到被百度收錄首頁在10天之內的,那請你不要著急,耐心的再等上5天左右的時間,90%的概率會得到改善。
不過這里還是要提醒你,新網站創建成功之后,你把很多的網站優化的問題都確定完善了。這時,每天應該保證按時、按量的更新至少1篇優質內容,我建議是3篇以上,至于以上多少根據能力而定。但質量一定過關。
針對新站點的列表頁、欄目頁、頻道頁不被收錄的。你最先想到的辦法還是更新,因為這些頁面都會隨著你文章、內容的發布,這些頁面或多或少也會變化。每天保持著變化。爬蟲就會到訪你的網站,在搜索引擎多次考究之后覺得你的文章內容質量高、更新頻率高、頁面體驗好的情況。你的內容就會瞬間被放出來很多。
所謂放出來,是指其實百度早就收錄了你很多的內頁,只是對新站有一個考察期。在考察期內沒有把這些收錄的內頁放出來。自然你就不知道是不是收錄了。
在這樣的時間范圍內,只有5%以內的是還在考察期。剩下的95%基本會被搜索引擎判定為低質量站點,你的內容質量低下,用戶體驗也不好,內容本身語句不通,更不能解決用戶需求。這樣的站點被評定為低質量站點后,就會導致長時間不收錄內容。
在這時候,你需要考慮以下四點因素:
文章質量是否達標?
文章質量首先我們要說一下文章是否為原創文章,這個時候需要我們利用原創文章檢測工具進行檢測,才能獲知文章的原創度,低于80%原創度的,都不能被看作原創文章。
額外文章的字數,千萬別寫個100~200字來敷衍了事。你可能會想到,我這篇文章的主題也就能寫這么多字,但一定能夠更多嗎,實在沒有更多就寫一些延展閱讀的東西為讀者提供更豐富多元且相關的內容。
然后是文章的排版,你的字體應該與背景色有明顯區分,字號不要低于14px,現在一般都至少16px了。段落間、字間都應有一些合理的間距設置。
最后一點是可閱讀性,即便你的文章是原創文章,排版非常清晰醒目,也有1000左右的文字。但如果是用戶閱讀起來十分困難,語句不通順,上文不接下語的。即便你獲得了很好的排名,也不可能長久的。
請你記住,收錄只是為了獲得排名的前期指標,而排名也是為了獲得流量,SEO的目的則是長期穩定持續的獲得這些流量。參與排名后,排名穩定也是很重要的。
新文章的鏈接有多少呢?
這里所說的新文章鏈接,是指內鏈。意思是通過首頁、列表頁、其他文章頁指向你這篇文章的鏈接數量總共有多少。在爬蟲抓取策略一文中,我們提到了幾個策略都和通過鏈接分析鏈接重要性的介紹。所以鏈接越多被爬蟲抓取的概率就越大,鏈接越多詳情頁的重要性也就越高,又被抓取又很重要的頁面,搜索引擎一定會盡快收錄。
那這種鏈接入口的形式應該怎么做呢?下面分幾個頁面進行說明。
首頁:首頁的首屏一定要有新發布文章的鏈接,首頁是最重要的頁面,且首屏是首頁中最重要的位置。這里一定要有最新發布的文章鏈接;
列表頁:除了這篇文章所屬的列表頁會調取他之外,其他的列表頁在右邊欄位置最好有一個“最新文章”板塊,一般建議調取10條即可;
文章詳情頁:其他的文章詳情頁在文章正文區域結束后的下面,可能在上下文章下,可能在相關推薦下或在右邊欄也可以也給出“最新文章”板塊,數量同樣為10篇最新的文章即可。
需要注意:如上給出的鏈接,在你每新發布一篇文章后,都應該在這些頁面的對應位置及時的出現。這樣才能被抓取到,這里特指一些靜態頁面,你不更新網頁頁面就沒有變化,導致加了這些模塊文章也沒能活的那么多的鏈接,自然沒有效果。
除了文章正文區域外,其他的區域與當前文章主題的相關度也很重要。搜索引擎現在是可以根據文字去理解你當前網頁綜合的所指內容。
當然,在當前頁面提供更多可供用戶選擇的與其要查看內容相關的拓展文章,也能增加網頁的粘度。針對這個我想提醒一下小編的同學,我建議你在發布一篇文章的時候最好能在當天發布至少3篇同一主題的文章。
這個在很早之前就有很多人說到,文章要定時定量更新,我在2016年針對性的做過測試。測試場景是這樣:我通過每天定時定量的更新維持了大概1個月的時候,最后實現了分鐘級的收錄現象,十分高興。然后我在之后的十天里沒有在發布文章,等我第11天又開始發布的時候,當天發布的文章在第三天才被收錄。這種延遲性收錄的現象大概持續了7、8天的時間。當然這7、8天的時間里我都一直堅持每天更新2篇文章,但沒有定時定量。在第9天我又重回文章秒收的狀態。
如上的四點因素,你針對內容本身的考慮因素且是必須做到的。我博客的案例是分鐘級收錄。但你現在重點解決的雖然是收錄問題,但要實現分鐘級甚至秒收也只是時間問題。