AI收錄網站內容佔60%~80%,網站管理者得調整策略,讓網站高品質內容能被納入AI的「訓練資料集」,這跟傳統SEO操作不完全相同,過去網站管理者只在意Google搜尋引擎,但現在情況真的不一樣了,現在很多人找資料都是靠AI搜尋或是AI助理來完成,AI已經很重要的主流管道,如果AI不認識網站內容,等於失去未來一半以上的曝光機會,這是現在進行式。
〈延伸閱讀:Google AI Mode是什麼?AI模式(AI Mode)將改變你的搜尋習慣〉
AI如何收集資料?
你得先理解AI收集資料的方式,才能進一步讓AI收錄資料,AI跟Google爬蟲不太一樣,Google是即時爬取網頁,AI (大型語言模型LLM) 則是依賴「預先學習」,透過閱讀龐大的「訓練資料集」來學習知識的,這個資料集通常不是即時更新的,是預先收集的。〈延伸閱讀:AI Overview(AIO)是什麼? 讓Google幫你用AI摘要答案〉
AI 資料來源有哪些?
網站內容
收集各式各樣的網站內容,網站收集比例是60%~80%(不同AI有不同的比例),通常是排名前幾頁的網站,像是Common Crawl (一個公開的網頁存檔資料庫) 、維基百科,是AI獲取公開知識的主要來源,因為這些網站可信任度高(EEAT),剛好跟google的排名邏輯一樣,所以網站希望可以被AI收錄,就需要提升被信任(EEAT)的內容讓AI信任,Common Crawl 是非營利組織,Common Crawl定期大規模抓取全球公開網頁並建立資料庫,許多AI模型都依賴這份資料進行訓練,收錄各種語言,當然也包含中文網站(6%),維基百科更是AI收集資料的大本營,因為維基百科的資料可信任非常高。〈延伸閱讀:EEAT 是什麼? SEO最重要的搜尋質量評估〉
社群平台
社群平台像是Reddit、X平台上的大量討論串,AI從這裡學習人類的對話方式和觀點,比例約10%~15%,非專業知識學習,會從社群的一些評價去決定是否引用網站內容,作為信任度的評估。
電子書、學術論文、各種專業
AI會從電子書、學術論文、各種專業,AI會學習複雜的知識體系,例如會從程式碼網站學習邏輯結構還有語法,這些資料佔比不高(5%~15%),很多資料是沒有公開的,需要另外讓餵養AI,是決定AI專業能力的關鍵,也是各家AI學習的技術。
與AI互動的過程
使用者跟AI的對話紀錄,也會被AI當作學習資料,用來優化未來的回答,但這類資料通常會經過人工審核確保品質。SEO會影響AI收錄嗎?
SEO優化對AI收錄當然有影響,網站內容專業、有深度、排名第一頁、網站權重高會被收錄到AI,AI也會去撈Common Crawl 這類大型資料庫,不斷交互被收錄等於提高了「被AI學習的機率」,尤其是Google體系的AI更是重視SEO,SEO架構必須要優化,尤其是「結構化資料」 、EEAT的網站內容、內外連優化、社群評價、商家評論…,都是幫助AI準確理解網頁內容,讓AI知道這是一個可以收錄的網站內容。〈延伸閱讀:SEO是什麼?SEO行銷初學者必看,快速學會SEO基礎〉
提升AI收錄機會的方法有哪些?
強化網站的結構化資料
網站的結構化資料(Schema)的正確使用,讓AI更容易分類你的資訊,這點又完全跟SEO邏輯一致,找一個已經具備SEO邏輯的網站非常重要,千萬不要覺得網站都差不多。〈延伸閱讀:結構化資料是什麼?對關鍵字排名有幫助嗎?〉
內容獨特性與深度
確保網站內容的真實性、獨特性、深度、清晰觀點,AI傾向引用具有權威性或觀點明確的內容, 這完全跟SEO邏輯一模一樣。〈延伸閱讀:文案怎麼寫?文案撰寫技巧馬上學起來!〉
增加在高權重網站、社群曝光
增加內容在高權重網站、社群的曝光,這內外連的優化,可以增加被AI收錄到資料集的機率,就像前面提到的評論也很重要,連結優化(權重)也是SEO優化的做法之一。
加入AI的思維
思考AI思維進行AI優化「AIO」(AI Optimization),增加網站更多「問與答」的內容,讓AI在回答用戶問題時,更容易直接引用網站內容。
結論
面對AI世代來臨,網站管理者必須為AI準備好內容,這不只是為了搜尋排名,更是為了迎接AI時代全新的流量入口,現在的佈局將決定未來幾年的網路能見度,而SEO是完全無法不執行了,因為這是未來企業的網路世界生存的關鍵。〈延伸閱讀:10個方法讓你選對SEO公司,不再浪費錢在SEO上〉
(本文為達文西數位科技所有,禁止轉載文圖)
我是Ago,熱愛SEO與AI應用,享受從數據中挖掘機會,幫客戶的網站衝高排名與AI收錄,將Google流量變成真正的訂單。