江苏SEO团队专注江苏SEO优化,江苏网站建设服务,免费提供网站SEO诊断数据分析报告。

SEO培训

学习蜘蛛抓取策略:网页分析预处理

搜索引擎通过蜘蛛抓取网页之后,首先做的工作就是预处理。这里包括消重去噪,不相关的、大量重复的内容都属噪音板块。如:导航条,底部版权信息,次导航等。然后就是网页净化,提取出重要数据板块,这里面包括元数据,如网页标识,关键词,摘要,正文,相关链接等。然后给予对重要数据板块的识别,会对内容进行划分,网页主要可以分为三类:主题型网页,链接型网页,图片型网页。

接着提取相关关键词,这里需要用到分词技术,分词方法包括:正向匹配,逆向匹配,最大最小正向逆向匹配。谈到噪音板块,有时候需要对网页增加噪音,因为网页内容主题过于偏移的时候,当然有时候又需要减少噪音板块,提高关键词密度。

重点介绍一下网页消重算法,这里讲到指纹的概念,搜索引擎会对每一篇文章,每一段话都进行MD5加密,从而建立指纹,判断文章的原创度就是通过指纹的对比来进行的。早期的搜索引擎还有摘要的算法,即对每篇文章的开头摘要部分建立指纹,但是摘要还不够准确判断一篇文章的原创度,于是接下来就有了分段算法和分句算法,这还不够,因为很多伪SEO喜欢用同义词替换等方法来影响搜索引擎的判断,最终就有了前N个关键词指纹算法,意思是不管你的文章内容怎么变,但是关键词是不会变的,当然,如今搜索引擎更加智能,还可以通过图片识别的方法来判断一篇文章的原创度,包括图片上的文字,百度也是可以识别的。

这里我们介绍一个案例,很多朋友问商城应该怎样优化?其实很简单,只需要做好内容页的优化即可,具体可以参考京东商城。思路是:首先标题一定要原创;产品描述全部用图片,一个图片alt放一个keyword;最好多增加一些人工评论,当然评论的内容可以去某宝上面去找。

总结,对于个人站长来说,想要获得不错的排名,推荐用主题型的网页,此外还需要多用一些权重标签来提升关键词的重要性,如h标签。

本文地址:https://www.jppbj.cn/blog/194.html

合作伙伴:魔贝课凡  搜外网  卢松松博客  站长之家  

Copyright @ 2020 www.jppbj.cn 江苏SEO团队 版权所有 苏ICP备19061521号-1  免责声明:网站部分内容转自网络,如有疑问请联系我们
服务区域:常州seo徐州seo南京seo、淮安seo、南通seo、宿迁seo、无锡seo、扬州seo、盐城seo、苏州seo、泰州seo、镇江seo、连云港seo