搜索引擎关键词优化原理
搜索引擎关键词优化原理是什么?首先我们要知道的是搜索引擎在第一时间接触到我们的网站链接之日起,首先要做的优化关键词的前期工作说起。在了解搜索引擎关键词优化之前它要操作内容有哪些从而能有的放矢的进行优化操作。
下面小编变来一一说一下搜索引擎关键词优化的原理有哪些?
一、抓取索引
搜索引擎在第一时间接触到了网站的链接之后要做的第一步工作就是查看网站的协议。这个协议就是robots.txt协议,看完协议之后才能知道网站的哪些页面能抓取,哪些页面不能抓取。搜索引擎是遵守网站的君子协议。我们在优化网站的时候一定要做这份与搜索引擎的协议。将这份协议上传到网站的根目录。
在robots.txt里面要敝屏蔽登录页面链接及关于我们链接。因为登录页面的链接不能让搜索引擎抓取到,这样容易泄漏登录账号密码而导致网站的的安全受到威胁。
二、布局网站地图链接
搜索引擎在看过robots.txt协议之后就对网站的内容抓取心中有数了。我们要做的就是将网站的地图放在这份robots.txt协议中,为搜索引擎抓取网站的链接提供方便。而网站的地图又有三种,一种是供搜索引擎抓取的XML链接、一份是txt文档及html文档。本人的博客做的是html文档。html文档的好处就在于能够给该条文章的标题增加用户的点击权重。当然搜索引擎也能识别,只是没有XML能让搜索引擎喜欢而已。如果你希望能让搜索引擎尽快的识别并抓取你的网站上的页面链接的话可以考虑用xml文档。
三、搜索抓取网站链接的方法
搜索引擎在爬取到网站链接并看了协议之后,接下来的事情就是要将判断网站的权重的大小来调整抓取的方法以便能提高抓取的效率。而搜索引擎抓取的方法有二种,一种是横向抓取,一路是纵向抓取。横向抓取的网站是针对权重低的新网站。纵向抓取是针对权重高的老网站。一般高权重的老站都是一些比较深的路径,栏目多,层级多,如果采取横向抓取的方法容易导致遗漏一些层级深的页面。
四、放弃转载页面、空白内容页面
搜索引擎在第一次爬行完整个网站后,也知道了网站的协议内容,不该抓取 的页面也不会抓取。但是对于一些低质量页面、转载量过多的页面、相似度高的页面会在这时给屏蔽掉。这个问题也是之前我遇到过的问题。之前我在运营一个经融内的网站时,因为不懂经融行业而无法写出金融行业的原创文章,于是只有抄袭别的网站的内容。后来网站运营了几个月也没有见到收录数据。一查原来是网站的内容全部是复制粘贴造成。
这失败就告诉我们在运营网站的时候一定要支持原创文章才能被搜索引擎青睐。
五、建立索引库
搜索引擎依据他的最有效果的抓取方式将网站上所有的值得抓取的页面全部抓取完后就会放到一个索引库中,等待回过头来进行数据分析归类处理。
六、搜索引擎进行关键词提取
当搜索引擎将网站上能索引的页面全部索引到数据库中之后,就要开始对这些页面进行关键词提取。在提取关键词之前要先对这些页面里面的代码进行隐藏忽略处理。剩下的全部是中文关键词。关键词出来后还有一个问题就是每个页面共享一个头部内容、底部内容及侧边栏目的内容。这些内容里面也有中文关键词,第二步就是去掉这些版块的中文关键词内容。
剩下来的就是页面的主体文章关键词信息。而这些关键词也要进行分词处理,将这些关键词分到不能再分为止后再统计同相关键词词根出现的频次并做好排序处理。
比如我就拿这段文字内容来举例说明:
四、放弃转载页面、空白内容页面
搜索引擎在第一次爬行完整个网站后,也知道了网站的协议内容,不该抓取 的页面也不会抓取。但是对于一些低质量页面、转载量过多的页面、相似度高的页面会在这时给屏蔽掉。这个问题也是之前我遇到过的问题。之前我在运营一个经融内的网站时,因为不懂经融行业而无法写出金融行业的原创文章,于是只有抄袭别的网站的内容。后来网站运营了几个月也没有见到收录数据。一查原来是网站的内容全部是复制粘贴造成。
这失败就告诉我们在运营网站的时候一定要支持原创文章才能被搜索引擎青睐。
我将这段文字内容进行分词处理后的结果:
四 、 放弃 转载 页面 、 空白 内容 页面 搜索引擎 在 第一次 爬行 完整 整个 网站 后 , 也 知道 了 网站 站的 协议 内容 , 不该 抓取 的 页面 也 不会 抓取 。 但是 对于 一些 低质量 页面 、 转载 量过 多的 页面 、 相似 度 高的 页面 会 在 这时 给 屏蔽 掉 。 这个 问题 也是 之前 我遇 到过 的 问题 。 之前 我 在 运营 一个 经 融内 的 网站 时 , 因为 不懂 经 融 行业 而 无法 写出 金融 行业 的 原创文章 , 于是 只有 抄袭 别的 网站 站的 内容 。 后来 网站 运营 了 几个月 也 没有 见到 收录 数据 。 一查 原来 是 网站 站的 内容 全部 是 复制 粘贴 造成 。 这 失败 就 告诉 我们 在 运营 网站 站的 时候 一定 定要 支持 原创文章 才 能被 搜索引擎 青睐 。
这些不能再细分下去的词根就是搜索引擎要进一步进行细分的关键词。接下来就要对这些词根进行重复数据统计工作。我省去这一步操作,用一个示例来说明一下:
放弃(5)
转载(3)
空白(4)
内容(6)
依此类推下去,对该页面下面的每一个词根进行重复数量的统计。
五、对提取后的词根进行重要性分析
这些拆解后的一大堆词根都是搜索引擎需参与排名的吗?显然不是。于是关键词的重要性分析就出场了。搜索引擎对这些词根进行重要性分析的依据就是从五个方面进行。
1、title标题上的关键词
title标题中的关键词是整个页面中重要的关键词。
2、h1标签上的小标题中的关键词
h1标签中的关键词是重要的参与排名的重要的关键词
3、strong加粗标签
strong标签中的标题关键词是参与排名
4、mata标签中的关键词
mata标签中的关键词也是参与百度排名,这些关键词也是重要的关键词。
5、黑体字标签
黑体字标签也是参与百度排名
6、关键词密度
搜索引擎通过对参与排名的关键词的密度来判断关键词的权重,并依据该权重来判断关键词的排名。
7、内链锚文本
内链锚文本中的关键词也是参与网站的关键词排名。
例如:title标签中的标题是:搜索引擎关键词优化原理,将这个标题中的关键词进行拆分到最细的不能拆分的词根,搜索 引擎 关键词 优化 原理,并在该页面中统计一下重复出现这些关键词的数量。
搜索(30)
引擎(18)
关键(26)
词(23)
优化(11)
原理(1)
这些词根都是一个title标题中的词根,并对应着它的链接
h1标签中的标题:抓取索引 分解的关键词根 抓取 索引,它的重复数据:
抓取(5)
索引(3)
strong标签中的关键词 搜索引擎抓取 搜索 引擎 抓取
词根数据:
搜索(5)
引擎(3)
抓取(2)
mata标签中的关键词 关键词密度 词根:关键词 密度
词根数据:
关键词(3 )
密度(6)
六、正向索引带关键词的链接
我们分析好了重要的参与网站排名的关键词并统计好了每一个重复出现词根数据后就知道了这些词根哪个重复出现的次数多,哪些词根重复出现的数据少,从而知道了这些词根的重要性与否。
每一个页面都有它的title、h1、storng、mata及关键词密度数据。这些就是备用的词根库。
每一个title及h1标签中的关键词词根都有若干个。而这些词根对应的链接只有一个。当这些词根被用户搜索出来能参与排名的链接也就是这个链接。也就是说一个链接可以由几个词根参与排名。我们可以将整个网站中的每一条链接对应的关键词都可以例出来整妆待发。
url 内容
url1 词1 词2 词3
url2 词2 词4 词5
url3 词3 词4 词6
七、页面的重要性
页面的重要性其实前面也讲了一些。四大标签title、h1、storng、mata加上关键词密度、网站的结构、页面的权重、文章更新时间、文章更新频率、与首页的位置、流量多少?专业性、页面的权重、页面层级、网页架构 、文件形式。这里的文件形式指的是html及asp、php。
八、倒排索引
倒排索引是反过来对前面的关键词词根进行按照从多到少的顺序进行排序。例如:
赣州 链接 SEO 链接
1 sbc.com 1 avb.com
2 abn.com 2 sdf.com
————————————————————————————————————
8 vbn.com 8 vbn.com
关键词1后面的括号是它在网站页面中出现的次数。我们就是要统计每个关键词词根在页面是出现的次数。而每一个关键词词根都有对应的链接。将这些对应链接的词根分类整理好后并按序排列。以便为搜索用户的搜索之用。
根据搜索引擎关键词优化原理告诉我们不能去转载、抄袭别的网站的文章。搜索引擎抓取网站的第二步就是提取网站关键词。在对这些关键词进行拆分成为一个个再也不能拆分的词根后,就进行出现次数的统计。再根据出现的多少来判断词根对于网站的重要性。这就告诉我们站长要在将想要有排名的关键词进行多频次的出镜。同时还要将参与排名的关键词放在标签里面,引起搜索引擎的重视。对于重要的页面的关键词标题要放在距离 首页近的位置以便让搜索引擎能在第一赶时间以现并引导抓取。想要稳定某个关键词的排名或者是想要让某个关键词有排名,得多做高质量外链。
本文出自 萧红SEO提供免费SEO网站诊断服务,转载时请注明出处及相应链接。
本文永久链接: https://360seo.cc/yuohua/5367.html
近期评论