为什么有些原创文章不被百度收录
1个回答
展开全部
之所以很多站长一直纠结,自己的原创心态被一次又一次的打击和创伤。主要还是没有真正理解到搜索引擎对“原创”二字的定义。今天通过狭义和广义两个方面来诠释一下搜索引擎眼中的“原创”二字。
狭义的原创
对很多用户来说,原创即自己写的内容。这也是狭义的原创,也正是这个狭义的原创,给坚持原创的站长们带来了或多或少的迷惑,也正是这个狭义的原创让他们对搜索引擎公平性产生怀疑,总觉得搜索引擎对自己另眼相看,而对大站无比眷顾。
而事实并非如此,在狭义的“原创”一节里,大家需要搞清两点:一、原创并非优质;二、原创内容并非单指文字。
一、原创内容并非优质内容
确实,从字面意思上来看,原创就是自己亲自撰写编辑的内容,自己网站首发的内容。但是大家一定要明白一个细节,原创并非优质。而搜索引擎之所以喜欢原创,主要是想把优质的不重复的内容展现给用户。如果仅仅是原创,而并不非优质的内容,同样不是搜索引擎想要的内容。因此,一定要清楚,搜索引擎要的是优质内容,而不仅仅是简单粗略的原创。
并且,百度内部已经专门成立了质量topic团队,专门从内容角度去考虑是否对用户有帮助是否体验好,因此一定要在原创的基础上创作优质的内容。
二、原创内容并非单指文字
搜索引擎蜘蛛抓取一篇文章,是从整个页面的HTML进行的。而并不是跳开程序,去简单的抓取几段文字这么简单。你的原创文章没有收录,也并不一定是你的文章不优质,而是你的整个网页对搜索引擎来说还不够优质,所以这篇优质的文章嵌套进这个网页后,和头部、页脚、左侧栏、广告等模块塑造了一个完整的页面。而塑造出来的这个页面,对搜索引擎有可能并不友好。
而别人转载去却收录了,是因为你的这篇文章嵌套进其他网站的页面后,同人家页面的头部、页脚、右侧栏、图片、相关推荐、简洁规范的代码等优质模块相结合,塑造出了一个全新的优质页面。而这个优质页面是搜索引擎需要的。从表面讲,文章还是那篇文章,页面却早已不是原来的页面,而是一个全新的页面。(大爷还是曾经的大爷,大妈已经不是当年的大妈了)
广义的原创
谈到广义的“原创”,实际上是一个价值体现的问题。一篇文章在不同的网站带来了不同的价值,这是广义“原创”的真正含义。
同样,广义的“原创”也有两个概念,一是内容二次加工;二是内容潜在价值的重新塑造。
一、 内容二次加工
一篇文章原创首发到一个日访问量几十IP的博客上,跳出率很高,用户浏览完之后不留任何痕迹。而又被一个日均IP几万甚至几十万的大网站转载之后,网民纷纷回复,展开各种讨论。从内容本质上来讲,回复内容给这篇文章增加了新的知识点,新的内容拓展。因此,对搜索引擎来说,这篇文章转载过来后,进行了二次加工,塑造出了一篇新的原创内容。
二、潜在价值的重新塑造
一篇文章,无论多优质,发布到一个每天只有几十个IP的个人博客上,意味着什么?
意味着这篇文章只能给几十个人带来潜在价值。而搜索引擎是一个服务于广大用户的平台,它希望挖掘更多优质内容给更多的用户带来潜在价值。
而同样这篇文章被一个几万甚至几十万流量的大网站转载之后,将有上万人阅读到这篇文章,也就是说,如果这篇文章真的很有用,那么将有上万人会收益。而这恰恰是搜索引擎存在的意义。因此,虽然文章还是之前的文章,但是所创造的价值却是一个全新的价值。既然这样,理所当然搜索引擎会把这个网页排名调整到靠前位置,因为它越靠前就会对用户越有用。
综上所述:我要说的是站长原创内容是一个很好的习惯。但是一定要首先明白搜索引擎眼中的原创指的是什么,不仅仅是单纯的指几段文章或者几张图片。只有这样,才能更好的去做好优质的原创内容和优化好页面;同时,也能更好的平衡原创生涯中遇到的各种心理平衡问题。其实关于开篇提到的几个同质化的问题,其影响因素远不止本文章提到的这些,还有更多因素来解答以上的问题。由于篇幅问题,仅此罢笔。
狭义的原创
对很多用户来说,原创即自己写的内容。这也是狭义的原创,也正是这个狭义的原创,给坚持原创的站长们带来了或多或少的迷惑,也正是这个狭义的原创让他们对搜索引擎公平性产生怀疑,总觉得搜索引擎对自己另眼相看,而对大站无比眷顾。
而事实并非如此,在狭义的“原创”一节里,大家需要搞清两点:一、原创并非优质;二、原创内容并非单指文字。
一、原创内容并非优质内容
确实,从字面意思上来看,原创就是自己亲自撰写编辑的内容,自己网站首发的内容。但是大家一定要明白一个细节,原创并非优质。而搜索引擎之所以喜欢原创,主要是想把优质的不重复的内容展现给用户。如果仅仅是原创,而并不非优质的内容,同样不是搜索引擎想要的内容。因此,一定要清楚,搜索引擎要的是优质内容,而不仅仅是简单粗略的原创。
并且,百度内部已经专门成立了质量topic团队,专门从内容角度去考虑是否对用户有帮助是否体验好,因此一定要在原创的基础上创作优质的内容。
二、原创内容并非单指文字
搜索引擎蜘蛛抓取一篇文章,是从整个页面的HTML进行的。而并不是跳开程序,去简单的抓取几段文字这么简单。你的原创文章没有收录,也并不一定是你的文章不优质,而是你的整个网页对搜索引擎来说还不够优质,所以这篇优质的文章嵌套进这个网页后,和头部、页脚、左侧栏、广告等模块塑造了一个完整的页面。而塑造出来的这个页面,对搜索引擎有可能并不友好。
而别人转载去却收录了,是因为你的这篇文章嵌套进其他网站的页面后,同人家页面的头部、页脚、右侧栏、图片、相关推荐、简洁规范的代码等优质模块相结合,塑造出了一个全新的优质页面。而这个优质页面是搜索引擎需要的。从表面讲,文章还是那篇文章,页面却早已不是原来的页面,而是一个全新的页面。(大爷还是曾经的大爷,大妈已经不是当年的大妈了)
广义的原创
谈到广义的“原创”,实际上是一个价值体现的问题。一篇文章在不同的网站带来了不同的价值,这是广义“原创”的真正含义。
同样,广义的“原创”也有两个概念,一是内容二次加工;二是内容潜在价值的重新塑造。
一、 内容二次加工
一篇文章原创首发到一个日访问量几十IP的博客上,跳出率很高,用户浏览完之后不留任何痕迹。而又被一个日均IP几万甚至几十万的大网站转载之后,网民纷纷回复,展开各种讨论。从内容本质上来讲,回复内容给这篇文章增加了新的知识点,新的内容拓展。因此,对搜索引擎来说,这篇文章转载过来后,进行了二次加工,塑造出了一篇新的原创内容。
二、潜在价值的重新塑造
一篇文章,无论多优质,发布到一个每天只有几十个IP的个人博客上,意味着什么?
意味着这篇文章只能给几十个人带来潜在价值。而搜索引擎是一个服务于广大用户的平台,它希望挖掘更多优质内容给更多的用户带来潜在价值。
而同样这篇文章被一个几万甚至几十万流量的大网站转载之后,将有上万人阅读到这篇文章,也就是说,如果这篇文章真的很有用,那么将有上万人会收益。而这恰恰是搜索引擎存在的意义。因此,虽然文章还是之前的文章,但是所创造的价值却是一个全新的价值。既然这样,理所当然搜索引擎会把这个网页排名调整到靠前位置,因为它越靠前就会对用户越有用。
综上所述:我要说的是站长原创内容是一个很好的习惯。但是一定要首先明白搜索引擎眼中的原创指的是什么,不仅仅是单纯的指几段文章或者几张图片。只有这样,才能更好的去做好优质的原创内容和优化好页面;同时,也能更好的平衡原创生涯中遇到的各种心理平衡问题。其实关于开篇提到的几个同质化的问题,其影响因素远不止本文章提到的这些,还有更多因素来解答以上的问题。由于篇幅问题,仅此罢笔。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |