关键词是网站优化的核心概念之一,在网站优化实践中,很多工作都围绕着关键词展开。本文尝试从搜索技术原理与网站优化实践相结合的角度,总结SEO内容页面关键词布局的具体登陆方法。
1.介绍搜索引擎的技术原理
搜索引擎的核心底层技术是将用户的查询词用自然语言切割成有意义的短语,然后从索引数据库中查找包含全部或部分短语的内容并返回结果。
正常的搜索思维是取关键词,查找内容中是否包含关键词。假设您想从10个序列号为1-10的页面中搜索包含“关键字布局”的页面。搜索10页全文搜索单词“关键字布局”,并返回包含该单词的页面序列号。但如果你必须搜索数以百万计的页面,它会非常慢,所以我们发明了倒排索引的想法。(下图数据并非实际数据,仅作说明)
仅凭这一点还不足以对搜索结果进行排序。在不_的情况下,一个关键词出现在网页上的次数越多,就越能代表该网页的特点。前提是过滤掉停止词(停止词几乎是每个网页上的词,但不能表达任何具体的意思,如“DE”、“yes”、“Le”等)。如果我们可以将网页中出现的关键词的频率信息添加到倒排索引表中(缩写:wordfrequencyTF),就可以对网页进行排序。如下图所示:当我们的查询词被划分为“关键字1”和“关键字2”时,相关页面可以按照(3,5,1,2)进行排序。
假设我有两页1和2。倒排指标的信息如下:
我们搜索“如何布局关键词”,搜索的关键词是“关键词”、“如何”和“布局”。其中“keywords”、“how”、“layout”出现了两次,在页分别出现了两次、两次,共出现了6次;在第二页,“how”、“layout”出现了7次。根据上述逻辑,终的搜索结果排名为(2,1),这显然不是一个理想的排名结果。第2页的主题显然是关于“如何布局走”。此时,有必要引入逆文档频率索引(IDF)来解决这个问题。
关键字位置信息也是一个关键点。一般认为,标题中的关键词比正文中的相同关键词更能体现网页的主题特征。这就是H标签如此重要的原因。搜索引擎还可以根据代码布局和噪声比(比如停止字的频率)来确定导航、文本、侧边栏等的位置。位置信息将被标记在倒排索引列表中,以参与排序决策。
此外,还有一些其他常用的技术方法,如:两个单词索引/短语指数,“如何布局关键词”不需要分为三个短词,也可以分为“关键词布局”,“如何”,“如何布局”等等;组合找到相关词汇,“关键字”的“关键字”和“如何”“如何”等。
当然,在实践中,大型现代搜索引擎的倒索引模型要复杂得多,而且许多其他因素(其中一个关键因素是超链接分析)都涉及到排序算法,这些算法在空间和作者层面都受到限制,因此它们无法伸缩。
2.如何摆放关键词
标题中必须有关键词,但不能有完整的问题
由于搜索引擎会将查询词分成超过N个单词、双单词和短语,并添加相关单词将查询合并到查询中,所以标题中的关键词不一定是一个完整的问题,通常是“哪家公司做XXX更好”。标题不一定需要完整的单词。即使标题包含完整的句子,它也不匹配任何其他完整的句子。一个高质量的网页通常可以匹配数百个长尾关键词。显然,一个标题不可能包含所有这些内容。标题的另一个重要作用是吸引点击率,点击率也是排名的一个因素。但核心词汇“XXX”、“好”和“公司”必须出现。
TAG:网站优化关键词选择的原则和方法