AI收录网站内容占60%~80%,网站管理者得调整策略,让网站高品质内容能被纳入AI的「训练资料集」,这跟传统SEO操作不完全相同,过去网站管理者只在意Google搜寻引擎,但现在情况真的不一样了,现在很多人找资料都是靠AI搜寻或是AI助理来完成,AI已经很重要的主流管道,如果AI不认识网站内容,等于失去未来一半以上的曝光机会,这是现在进行式。
AI如何收集资料?
你得先理解AI收集资料的方式,才能进一步让AI收录资料,AI跟Google爬虫不太一样,Google是即时爬取网页,AI (大型语言模型LLM) 则是依赖「预先学习」,透过阅读庞大的「训练资料集」来学习知识的,这个资料集通常不是即时更新的,是预先收集的。
AI 资料来源有哪些?
网站内容
收集各式各样的网站内容,网站收集比例是60%~80%(不同AI有不同的比例),通常是排名前几页的网站,像是Common Crawl (一个公开的网页存档资料库) 、维基百科,是AI获取公开知识的主要来源,因为这些网站可信任度高(EEAT),刚好跟google的排名逻辑一样,所以网站希望可以被AI收录,就需要提升被信任(EEAT)的内容让AI信任,Common Crawl 是非营利组织,Common Crawl定期大规模抓取全球公开网页并建立资料库,许多AI模型都依赖这份资料进行训练,收录各种语言,当然也包含中文网站(6%),维基百科更是AI收集资料的大本营,因为维基百科的资料可信任非常高。〈延伸阅读:EEAT 是什么? SEO最重要的搜寻质量评估〉
社群平台
社群平台像是Reddit、X平台上的大量讨论串,AI从这里学习人类的对话方式和观点,比例约10%~15%,非专业知识学习,会从社群的一些评价去决定是否引用网站内容,作为信任度的评估。
电子书、学术论文、各种专业
AI会从电子书、学术论文、各种专业,AI会学习复杂的知识体系,例如会从程式码网站学习逻辑结构还有语法,这些资料占比不高(5%~15%),很多资料是没有公开的,需要另外让喂养AI,是决定AI专业能力的关键,也是各家AI学习的技术。
与AI互动的过程
使用者跟AI的对话纪录,也会被AI当作学习资料,用来优化未来的回答,但这类资料通常会经过人工审核确保品质。SEO会影响AI收录吗?
SEO优化对AI收录当然有影响,网站内容专业、有深度、排名第一页、网站权重高会被收录到AI,AI也会去捞Common Crawl 这类大型资料库,不断交互被收录等于提高了「被AI学习的机率」,尤其是Google体系的AI更是重视SEO,SEO架构必须要优化,尤其是「结构化资料」 、EEAT的网站内容、内外连优化、社群评价、商家评论…,都是帮助AI准确理解网页内容,让AI知道这是一个可以收录的网站内容。〈延伸阅读:SEO是什么? SEO行销初学者必看,快速学会SEO基础〉
提升AI收录机会的方法有哪些?
强化网站的结构化资料
网站的结构化资料(Schema)的正确使用,让AI更容易分类你的资讯,这点又完全跟SEO逻辑一致,找一个已经具备SEO逻辑的网站非常重要,千万不要觉得网站都差不多。〈延伸阅读:结构化资料是什么?对关键字排名有帮助吗? 〉
内容独特性与深度
确保网站内容的真实性、独特性、深度、清晰观点,AI倾向引用具有权威性或观点明确的内容, 这完全跟SEO逻辑一模一样。〈延伸阅读:文案怎么写?文案撰写技巧马上学起来! 〉
增加在高权重网站、社群曝光
增加内容在高权重网站、社群的曝光,这内外连的优化,可以增加被AI收录到资料集的机率,就像前面提到的评论也很重要,连结优化(权重)也是SEO优化的做法之一。
加入AI的思维
思考AI思维进行AI优化「AIO」(AI Optimization),增加网站更多「问与答」的内容,让AI在回答用户问题时,更容易直接引用网站内容。
结论
面对AI世代来临,网站管理者必须为AI准备好内容,这不只是为了搜寻排名,更是为了迎接AI时代全新的流量入口,现在的布局将决定未来几年的网路能见度,而SEO是完全无法不执行了,因为这是未来企业的网路世界生存的关键。〈延伸阅读:10个方法让你选对SEO公司,不再浪费钱在SEO上〉
(本文为达文西数位科技所有,禁止转载文图)
我是Ago,热爱SEO与AI应用,享受从数据中挖掘机会,帮客户的网站冲高排名与AI收录,将Google流量变成真正的订单。