在众多的SEO理念当中,或多或少的每一位SEO从业人员都有遇到一些优化中比较纠结的问题,而众多纠结的问题当中,收录一词是很多SEO人员提到比较频繁的词汇。今天我们不讲外链,也不讲内链,我们讲收录与排名,老样子,继续用案例给大家展示案例效果,如下图所示:
该站上线是2016年11月中旬,到文章截稿时间大约一周左右,从整体站点页面的收录速度以及排名中可以看得出,蜘蛛的抓取频率是非常快的。在给大家揭秘内页实战快速收录并且做到页面参与排名的方法以前,我必须的告诉大家两个点。
第一、该站点所有文章均为抄袭,任意一篇文章的内容百度上都出现了多次,打破了传统原创思维理念。
第二、这仅仅是一个刚上线的新站,并且没有使用任何所谓的蜘蛛池进行吸引蜘蛛。
那么就会有很多朋友会问,新站是如何做到快速收录并且可以建立部分页面参与排名的,这个话题是本文的研究核心。首先我不得不说一句,如果大家也遇到了收录问题,那么至少有一点你没有做好,那就是你一直在关于所谓的外链、内链、布局、原创内容。忘记了一个核心的点,就是搜索引擎排名原理。
首先要想做好页面收录并且参与排名,我们要先思考下搜索引擎工作原理,当然,别小看这种最最基础的东西,你领悟了核心要点,那么操作收录起来就会变得游刃有余,如下图所示:
通过百度百科的文档中我们可以看出,整个原理是从最初的爬行抓取>收录>建立索引>搜索词处理>排序,虽然才几个步骤,但是每个步骤都有他的核心要点。下面我将把整个核心要点给大家一一剖析。
一、爬行与抓取
首先我们要了解到搜索引擎蜘蛛要想爬行和抓取一个页面必须要满足两个特点,第一、足够的外链来吸引蜘蛛抓取;第二、网站的更新频率。在百度站长平台里面每个站点都会有一个抓取频次,而抓取频次我们可以特定的看作站点受蜘蛛的喜爱程度,也可以通俗的理解站点抓取频次越高,那么你站点被蜘蛛喜爱程度就会越高,从而你的收录就会加快。如果使用蜘蛛池这类程序的同学,我想就应该非常清楚,但是很多朋友即使使用了蜘蛛池那也只是外部链接进行吸引蜘蛛,如果配上站点更新频率,效果更佳!
二、收录与索引
大家都会通常的认为页面收录与页面建立索引并无太大区别,其实不然,在整个站点页面文档中会有两种情况发生:
1、URL收录=是,索引=否;代表已经进入了索引,只是这个网页的“权重”非常非常低,可以视作是“无效索引”。
2、URL收录=是,索引=是;代表已经有资格参与排名,但是不保证100%能获取排名,可以视作是“有效索引”。
我们可以简单的去理解site出来的站点页面是被收录的,但不代表site出来的页面是被索引的。但是我们依然可以去检测出页面是否具备参与排名的资格,如下图所示:
Domain与Site最大的区别在于后者可以统计页面收录,而前者我们可以分析出站点外链域,而这里的作用我们并不是去讨论外链域,而是仅仅使用Domain命令来检测站点能够参与排名的有效数值。
其实大家可以用一种非常简单的方法去快速检测你的页面是否有参与排名的资格,如下图所示:
上面三张图我们可以把site出来的收录页面进行搜索查询,可以检测到页面被收录,但是当你搜索整个标题却没有排名,也就是前面我提到过的url收录=是 但是url索引=否,说明网页“权重”较低,并没有参与排名,那么我们再来看几张图,如下图所示:
从上图我们可以看得出,该页面不仅仅被收录,还建立了索引,并且搜索整个标题可以检索到排名。从这点我们可以看出,索引的页面无需做任何外链、内链、甚至是抄袭的文章即可有参与排名的资格。那么问题来了,该如何进行有效的页面进行建立索引并建立起参与排名的资格?
很多人在思考一个问题,文章要尽量原创,满足用户需求,提高用户体验等等。但是为何有些站点收录非常好,排名也非常不错,文章却是采集或者伪原创。讲到建立索引以前,我们继续先把剩下的一个工作原理分析完毕。
三、检索与排名
在整个检索与排名中,会体现出最常用的两个搜索引擎原理,一个就是倒排索引,另外一个就是TF-IDF算法,首先我们来了解下倒排索引的更新策略,如下图所示(来自百度百科-倒排索引):
在整个倒排索引结构中,最常见的有四种更新策略,而上述的案例中就用到了其中两种,如果大家仔细的去观察我的每一个文章,就不难发现即使我的页面是纯抄袭文章,但是我抄袭的每一个标题和原来标题不相同,并且标题会更加的去符合页面内容,提升页面词频需求(TF-IDF)。其次则是抄袭的文章不会直接复制粘贴,我会进行重新排版,重构页面从而达到页面并非采集的作用。
在搜索引擎里面。有一个算法叫做TF-IDF算法,简单来说,TF-IDF算法(详细公式参考: http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html))是用来检索页面文档关键词出现的频次。并且可以通过该算法计算一个文件集合里面的词频出现的次数从而来评定一个页面的重要程度。而该重要程度是结合页面TITLE来计算,也就是大家常说的文章内容要符合页面标题的主题相关性(类似作文写作中的紧扣主题)。
看到这里,我相信很多朋友就会理解为何蜘蛛池程序可以快速提升收录并且有部分页面进行参与排名,很大的一个特点就是蜘蛛的频繁抓取,从而建立了索引,在短时间内让页面“权重”提升,并且促进排名,而新闻站点的原理也是因为蜘蛛抓取频繁的特点,几乎无需发布任何的外链即可有很好的排名。
现在我们再来分析和思考整个页面的抓取到最终的检索排名我一共操作了哪些:
第一、大量的不定时更新,让蜘蛛抓取频繁抓取(建议给百度提交站点地图,定时更新站点地图)
第二、大量采集文章通过修改标题与布局重构让页面变得更新有新鲜度(满足更符合页面的用户需求)
第三、每天保持大量的更新让蜘蛛抓取形成习惯
第四、由于该站是老域名,加上站点原始数据积累,可保持站点的权威度,从而相对新域名来说站点更加具备抓取优势。
总而言之,虽然最后只给大家留下了4点,当然也有很多SEO同学会觉得我说了一堆没用的,但是如何你真正的去领悟到我所提到的一些核心要点,那么你就不难发现SEO建立索引的奥妙所在,做SEO,思路决定出路,我更加建议seo同学们可以多去了解搜索引擎的一些基础算法和百度官方优化指南文档,如果能够把里面的任何一个核心点通过实战的方式去吃透他,那么比你看任何的所谓的SEO文章都要有价值!
来源:卢松松博客,欢迎分享,微信公众号:izhanzhang(QQ/微信:13340454)
天下网标王洛阳seo排名多少钱海南百度关键词包年推广公司恩施模板制作价格防城港网站搜索优化合肥网站关键词优化报价南京建设网站价格萍乡百姓网标王推广价格塔城网站开发报价伊春SEO按天收费哪家好白城seo网站优化价格信阳网站优化软件推荐双龙关键词排名公司伊春百搜标王推荐东营网站推广工具价格昌都网站优化按天计费推荐本溪网站推广报价许昌英文网站建设价格潜江企业网站改版多少钱揭阳优化公司湛江百度竞价包年推广哪家好喀什模板推广推荐龙岩关键词按天扣费多少钱上海外贸网站建设哪家好海南网站制作多少钱德阳百姓网标王推荐昆明网站设计推荐坂田网站推广工具多少钱新余网站改版报价南山网站改版推荐陇南网站推广工具香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤