1. 「柴叔SEO」首页
  2. SEO顾问

网站seo战斗SEO你应该先学习什么

seo12.jpg

SEO,你应该先学习什么?小霞的团队小霞在做SEO时首先了解搜索引擎的工作流程:

(1)爬行爬行

1批量收集:在Internet上收集带有链接的网页,通常需要几周时间;

2增量收集:在原始基础上收集新添加的网页,更新自上次收集以来已更改的页面,并删除重复和不存在的网页;

3提交自己:将自己的网站提交给搜索引擎。建议不要使用此方法,因为它很慢。

PS:搜索引擎蜘蛛是搜索引擎的自动程序。其功能是访问Internet上的网页,图片和视频内容。

URL是搜索引擎的跟踪。查看搜索引擎是否已抓取您的网站,具体取决于服务器日志是否包含该网址。

4搜索引擎蜘蛛爬行策略

搜索引擎蜘蛛主要通过抓取页面上的链接来收集新页面,并通过十字架爬行以形成蜘蛛网。

我深度爬行(A-B-E-A-C-F-H-A-D-G-H)

II广度优先爬行(A-B-C-D-E-F-G-H)(最常见的方式,如此多的SEO优化器将通过站点地图将所有链接放在网站上)

PS:如果搜索引擎蜘蛛访问层设置为3,则不会收集H网页,因此网站结构的扁平化非常重要。

5搜索引擎蜘蛛如何避免重复收集

我引起了重复收集的原因:

蜘蛛不记录已访问过的URL;页面由多个域名引起。

II解决方案:搜索引擎已经建立了两个表:访问表,未访问表。

6搜索引擎蜘蛛如何确定页面不重要

I页目录越小,用户对体验的看法越好;

二,原创内容更多,更好,更重要;

III更新程度一个有价值的网站每天都会更新,用户每天都会来看看;

IV高质量的相关链接导入:高质量,高质量的网页愿意链接到您的网站,这证明您的网站质量也很好。

(2)预处理

1关键字提取

搜索引擎蜘蛛抓取大量的HTML代码,Javascript,css,div标签等,要删除,搜索引擎可以完全识别文本内容,因此关键字提取是删除未知标签,留下文字;

2删除停用词

像“得得”,“的”,“地地”,“啊”,“呀”,“再再”等反复出现的无用词语被称为停用词,删除停用词;

3分词

基于I的统计分割方法

分词词典和包含的在线流行词是搜索引擎的基础,例如:我想睡觉,其他的神是云;

基于字符串匹配的II字分割

例如,设置分词词典的最大数量是3,然后是以下段落的单词:首先提取前三个单词,我要睡觉,我要在没有单词的词典中睡觉,取消睡眠,让我想要,我想要一本字典世界上没有这样的字。我想摆脱它,离开我,然后提取三个字来睡觉。我在字典里没有这个词。我想摆脱它,让它睡觉,没有任何言语睡觉,并把它带走。离开它,然后提取三个单词进入睡眠,在字典中睡觉,没有这样的单词,把它拿走,在睡眠字典中有这个单词,离开睡眠,依此类推。

我要睡觉,其他的神是云;

我,想要,睡觉,别人,神,马,云;

4消除噪音

在网页上删除各种广告文字,广告图片,版权信息,登录框等;

5创建关键字库

提取关键字后,将页面转换为关键字组合,记录页面上每个关键字的频率,外观,格式和位置;

6连接关系计算

搜索引擎必须事先计算页面上的哪些链接指向其他页面,这些页面导入到每个页面的链接,用于链接的锚文本等等;

7特殊文件处理

无法直接读取Flash,视频,图像等。

(3)服务输出

搜索引擎有自己的相关排名机制,主要根据网页的相关性,关键词的密度,网站的权重等来确定输出内容的排名(付费促销总是排在前几个)。

小编seo团队小霞推荐阅读《企业对于SEO优化的需要》

原创文章,作者:柴叔seo,如若转载,请注明出处:https://www.cxta.com/13373.html

发表评论

登录后才能评论

联系我们

13888888888

在线咨询:点击这里给我发消息

邮件:888888@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code