今天重点来介绍一下影响关键词重要程度的因素。

首先是特征标签,包括容器标签和权重标签。学过html知识的同学应该知道,div和span就是最常见的容器标签,权重标签在前面也提到过,像h标签,strong,b,i等凡是让文字突出展示的都属权重标签。值得注意的是,标签最多叠加两个,如<h1><b></b><h1>。另外,标题字数太长也将稀释权重。

然后是tf*idf算法。TF的概念:关键词频率=关键词/总词数。IDF的概念:倒置文档频率=总文档数量/关键词多少文档中出现。所以说,控制好关键词的频率十分重要,注意噪音板块不堆砌关键词。同一关键词在标题里面最多出现两次即可。

最后是外链。最典型的例子就是谷歌炸弹事件,只要某个关键词的外链达到一定的数量,那么这个关键词的重要性不言而喻。关键词重要度仅表示可能获得排名的关键词,不代表一定能获得排名。原创文章对网站排名十分重要,最好一篇也不要用采集的垃圾文章。

推荐阅读:如何提高关键词的搜索排名?

tf*idf算法科普

TF*IDF想必大部分做SEO的都听说过,也知道TF*IDF的原理,不过知道如何运用TF*IDF的SEO就比较少了,今天就简单的介绍一下TF*IDF的原理并介绍一下我是如何在SEO实战中运用TF*IDF的。

所谓TF是指词频,也就是关键词在文章中出现的频率,大部分情况下都是指关键词出现的次数,因为文章长度的缘故,单纯的词频不能反映该关键词与此文章的相关性,在排除一些干扰性因素后,关键词密度更能反映出关键词与文章的相关性,因此我在实际SEO应用中TF更多地用关键词密度来表示。DF是指文档频率,也就是说该关键词在多少文章中被提及,一个关键词在越多的文档中出现,该关键词的特征就越不明显(我个人术语),例如“的”、“是”这样的词,在大多数文档中都会出现,因此就算在自己的文章中出现“的”、“是”的频率很高,你的文章与“的”、“是”的关系也不是很大。IDF是DF的倒数,因此有了TF*IDF这个公式。

在SEO实战中运用TF*IDF最大的难点是如何确实DF/IDF。虽然要准确的得到TF的数据也比较难(主要是个人没有百度那样的词库,得到的数据不准确),但起码通过自己的土算法可以得到个大概值(如爱站和CHINAZ的计算关键词密度的方法,注:此关键词密度不是真正的关键词密度)。一个关键词在多少个文档中出现,个人是不可能统计到的,在我刚接触TF*IDF的时候也因为这个问题,而只是理论了解TF*IDF的含义,并没有应用到自己的SEO工作中。实际上在搜索引擎里搜索一个词的时候,搜索引擎会提供一个数据,例如百度会提供“为您找到相关结果约**个”的数据,我在做垃圾站的时候,通常会利用程序计算出关键词密度,再利用这个数据计算出TF*IDF的值。虽然结果不准确,但起码有一定的理论依据,实际上也有一定的效果。

TF*IDF在大型网站的内部判断文章的相关性方面也有较大的用途,目前我还没有涉及这一方面,暂时不表。

相关SEO问题

您好,最近十分焦灼,网站依然没有好转,心想是不是八月份算法更新导致,最近观察了网站表现,索引量急剧下降,从百万索引跌到十万,这是很恐怖的,自然的影响了点击量下降了四五成,在五月份到八月份网站索引又是急剧上升,三十万涨到四百万,网站落差太大了,是不是网站自身的结构原因,在内容方面一直保持持续更新,网站类型属于电商,百万级产品。最近我观察到,在某个产品详情添加相关内容之后,然后提交谷歌抓取,一天后索引并收录了,但奇怪的是这个加入内容的页面又没有索引收录了,这个页面在质量上没有任何问题,相对于同行还是比较丰富,我想请问这是不是网站自身某个点出现问题了还是算法导致,这个下跌趋势将近三个月没有扭转。

江苏SEO回复

这个不仔细检查具体网站、流量后台、日志等,很难知道是怎么回事。

如果页面添加内容后被收录,然后又被删除,通常是页面内容质量问题。虽然你觉得质量没问题,但质量不只是看是否丰富,还有原创性、是否有附加价值、相关性等。现在Google Search Console后台会显示索引统计,有时间曲线,而且会显示页面为什么没有被索引,各种索引错误等等,建议仔细检查。

就我的经验,百万量级的电商网站,产品详情页面内容经常是重复的,各种各样的原因,不一定篇幅大就质量高。还经常有各种低质量页面,比如常见的按字母排序的产品列表页面,词库产生的引流页面等等。这也经常导致网站整体质量分降低,索引率下降。

大网站一般不会有明显的硬伤,都是各种细节上的小问题叠加起来的。

从你的描述不清楚索引量下降是不是8月份开始的,不过8月份的Google算法更新确实影响了不少网站。

本文来源:https://www.jppbj.cn/blog/198.html

版权声明:著作权归江苏SEO团队所有。商业转载请联系作者获得授权,非商业转载请注明出处。