爬虫内容及其对您网站排名的影响-Semalt专家Natalia Khachaturyan

抓取内容可以描述为从互联网上其他地方选择内容并将其作为您自己的作品发布在网站上的行为。有很多网站都包含其他网站的内容。一些网站会从另一个网站中挑选文章,然后将其作为自己的作品发布,而其他网站则可能会复制整个网站。

这种行为违背了Google设定的准则以及美国和其他许多国家/地区的版权法。大多数报废内容的人都意识到自己在做错事。因此,如果您不相信自己正在抓取内容,那么您可能就不会。

Semalt的内容策略 Natalia Khachaturyan表示,如果您要避免抓取的内容,建议在显示其他网站的信息时要格外小心。有时,网站管理员可能会在侧边栏中添加“ Twitter提要”或“最新提要”。不一定是坏事。在大多数情况下,在边栏中显示此类内容即可。但是,如果您显示的信息太多,则可能会违反Google准则。

这产生了以下问题,多少是太多?该查询没有具体的答案,但是完全可以理解,来自其他来源的内容不必超过您的Web内容的10%。一个很好的例子是一个包含新闻提要侧栏的典型博客。如果您的博客文章太短,那么新闻源可能会比博客具有更多的内容。

考虑一下搜索引擎如何查看这样的页面。可以得出结论,页面的大部分内容都是非原始内容或重复的内容(如页脚和徽标)。因此,您认为该网页可能不是该内容主题的理想资源。

您必须知道Google概述了一些它认为是抓取的示例。例如,从其他网站复制和重新发布内容而未向其添加任何形式的内容或未赋予其价值的网站被视为内容抓取工具。同样的情况也适用于从其他网站复制内容然后稍加修改的网站,可能是通过替换同义词然后重新发布。他们还可能尝试使用诸如文章微调器之类的自动化技术来修改内容。

同样,某些网站可能会从其他网站复制固定的内容供稿,而不会为用户提供任何形式的组织或利益。这些违反了Google的准则,因此可能会受到严惩。

抓取内容不仅限于书面内容。同样适用于嵌入式内容,例如图像,视频和其他形式的媒体。在这种情况下,某些网站可能会嵌入其他网站中的内容,而不必为用户增加任何实质性价值。搜索引擎也可能对此严加惩罚。这只会损害您在搜索引擎中的排名,而无助于提升排名。

mass gmail