收集站有出口吗?

当前位置: 首页 > 常见问题

纯采集站也可以很滋润。

我是一个纯收藏站长。下面的总结有些是关于SEO的,有些是关于采集和运维的。都是很基本的个人观点,仅供分享。请分清好坏,从实践中获取真知。

一个纯收藏站长的SEO,收藏,运维总结,SEO推广

原创还是收藏?

当然原创是好的,因为百度是这么说的。人是裁判。

为什么我创作了很多原创文章,还是没有收录?被收录了还是没排名?

一个搜索引擎,其核心价值是为用户提供他/她更需要的结果。搜索引擎有网民的统计需求,即使你是原创,也有可能被搜索引擎忽略,因为它不想在无意义的内容上浪费资源。

对于网民需求量大的内容,要更多更快的收录。但是因为收录内容多,即使你是原创,也可能很难挤进排名。

搜索引擎通过什么来识别网民的需求?

关键词。当每个人都在搜索一个关键词的时候,说明他/她对这个词相关的内容有需求。而且,使用搜索引擎的人,通常都有问答和搜索查询。当然,搜索引擎内部必须有一个庞大的分析系统来准确定位这些需求。详见百度指数。比如搜索的关键词是“手机”。很可能你是想买手机或者想查某款的价格,或者你只是想下载漂亮的壁纸。但是如果你想要壁纸,会有一个更准确的关键词“手机壁纸”,会以下拉框或者相关搜索的形式呈现。

如果原作好,为什么要收藏?

原创虽好,但只要方法得当,收藏效果不会比原创差太多,甚至会比没有掌握方法的人好很多。

由于精力有限,原创很难保证大量的长期更新。如果雇了编辑,投入产出比可能是负的。

市面上那么多收藏家,应该用哪一个?

每个收藏家都有自己的独特性,所谓存在即合理。请根据自己的需求选择。我的采集器是我自己开发的,开发过程中考虑了以下几个方面。其他收集器也可以用作参考:

。直接提供大量分类关键词。这些关键词是百度统计过的,有网民需求的词(百度指数),或者这些词的长尾词,来自百度下拉框或者相关搜索。

直接根据关键词进行采集,智能分析网页文本进行抓取,不需要自己编写采集规则。

。捕获的文本由标准标签清理,所有段落都标有

标签,乱码将被删除。

根据收集的内容自动映射图片,图片必须与内容高度相关。这样代替伪原创,不影响可读性,文章图文并茂,让原著提供的信息更丰富。

正文内容中的关键词自动加粗,要插入的关键词也可以自定义。但是没有所谓的影响可读性的“伪原创”功能,比如句子重排、段落重排。

可以直接用关键词及其相关短语作为标题,也可以抓取目标网页的标题。

。微信文章可以收藏。

无需触发或挂断。

。整合百度站长平台主动推送,加速收藏。

不同的网站程序,比如Dreamweaver,WordPress,dz,zblog,Imperial cms或者其他,是如何影响SEO的?

理论上没有影响。因为搜索引擎不知道你是什么程序,或者可以通过一些规则来识别,不可能因为程序本身的差异而影响其判断。

什么会影响SEO?答案是模板。基本上,这些程序有一个模板机制。同一个程序可以输出不同的页面,不同的程序可以输出相同的页面。这是模板。模板确定之后,你的每一个页面都会按照这个框架输出,也就是整个html结构已经确定了。而这个html正是搜索引擎应该重点关注的。它必须从这个html中获得它想要的信息。所以,一套好的模板很重要。

模板设计需要注意哪些细节?

。重量结构顺序。在整个页面的html中(注意是html,不是显示的布局),位置越高权重越高。由此可知,三个标签“标题”、关键词、描述,因为在前面,所以权重较高。第二个就是平时导航,基本上比较高,权重也很高。再次,是文章的标题和正文。这个是按照html的前后排序的。

因为搜索引擎首先要遵循WC标准,一些原本由WC定义的标签被用来表示重要信息,所以权重自然高。比如特别是H,用来表示当前页面的重要信息,一般每页只能有一个标签,其权重估计相当于标题,通常用来放当前页面的标题。当然,为了提高主页的权重,也可以使用H来放置logo或者主页链接。另外还有em、strong等标签,用来表示强调。一般认为强权高于tag,也是加粗功能。但是,我们认为从SEO的角度来看是没有权重提升的。

。css或js代码通常对搜索引擎没有意义。尽量用单独的文件存储,或者如果允许的话放在html的末尾。

网站结构规划需要注意什么?

。URL设计。URL也可以包含关键字。比如你的网站是关于电脑的,你的网址可以包含“PC”,因为在搜索引擎眼里它通常是“电脑”的代名词。网址不要太长,级别尽量不要超过级别。这就够了。

栏目设计。列通常与导航相关联。设计的时候要考虑网站的整体主题,用户可能感兴趣的内容是什么,栏目名称是网站的主要关键词,这样也方便使用导航的权重。

。关键词布局。理论上,每一个内容页都应该有其核心关键词,同一栏目下的文章应该尽可能以栏目关键词为主。一个简单粗暴的办法就是直接用栏目关键词的长尾词。

动态、伪静态和静态哪个更好?

这个不能一概而论。建议使用伪静态或静态。两者的区别在于是否生成静态文件,URL格式是否是动态的。生成静态文件本质上是为了加快访问速度,减少数据库查询,但会不断增加占用空间;伪静态仅通过重写URL来修改URL。其实每次还是要经过程序操作,查询数据库,输出页面,对于加快访问速度完全无效。动态和伪静态的唯一区别是URL带有问号和参数。

所以只要注意两点:网站打开速度够快吗?需要节省服务器空间吗?

不同的网站程序可能有不同的数据库操作效率。一般来说,如果内容页面数量小于10000,那么页面打开速度相对较快,数据量较大,达到10000、100000甚至更多,通常需要考虑静态化。

有哪些提高访问速度的方法?

。上面已经提到的统计化。

通常很多网站模板里都会有随机调用的文章或者类似的板块。其实对于数据库来说,随机性是一个很重的负担,模板中要尽量减少随机文章的调用。如果不可避免,考虑从数据库进行优化。对索引字段进行排序通常比没有索引要快得多。

。放不经常修改的文件,比如图片,js,css等。,在专用的静态服务器上,并且可以将多个js或css尽可能合并到一个文件中,以减少http连接的数量。

使用各种云加速产品。对于普通网站来说,免费的百度云加速或者新云加速都是可以的。

文章很多,网站已经静态开启,但是每次更新整个网站需要很长时间。我该怎么办?

我的做法是使用缓存机制,这里只提供一个思路,可能需要自己二次开发。

网站设置为伪静态。当每个请求到达时,程序检查是否有相应的缓存html文件。如果文件是在几个小时或几天前生成的,我们认为它需要更新。此时,执行正常流程。程序查询数据库后,生成html,将其写入缓存文件,然后输出到客户端。

当下一次访问到来时,例如,当几分钟后对同一页面的另一次访问到来时,再次检查缓存文件时间。从时间上可以判断文件很新,根本不需要更新,所以直接读取文件内容输出到客户端。这样每个页面都可以自动生成,只有第一个访问者会觉得慢,后面的访问者就相当于静态访问,速度非常快。

如果是独立服务器,还可以考虑自动检测服务器的负载。如果负载已经很高,即使判断需要更新,也暂时不更新,直接输出。

图片参考远程网站好还是放在自己的服务器上好?

这也是各有利弊的。引用远程URL可以节省自己的带宽,但是很可能因为对方服务器慢,或者资源被删除,或者使用了防盗链,导致图片无法显示。如果下载到自己的服务器上,当然一切尽在掌握,但是图片会占用很大的空间,可能比一般的静态生成要大,而且如果访问次数多,图片会消耗更多的带宽。

如何优化网站的内链?

内链是百度官方推荐的优化方法之一,这个必须要做。通常情况下,文本中会出现一个关键词,在这个关键词上添加一个链接,指向恰好是这个关键词相关内容的另一个页面。于是诞生了一些所谓的优化技术,强制在文本中插入一些关键词和链接,进行类似于互推的操作。另外,为了提高首页的权重,到处放网站名称,做首页链接,以为这样可以提高目标页面的权重。但这些很可能适得其反,因为搜索引擎会统计每个链接的点击率。如果你在显眼的位置点了一个链接但很少点,可能会被判定为作弊。所以,请只对已经在正文中的关键词做内链。

段落重排、句子重排、同义词替换这些伪原创技巧好吗?

不好。因为搜索引擎是智能的,不再是简单的数据库搜索,而是可以自然分析语义(详情请搜索“NLP”)。任何一个语义分析困难的句子或段落,都可以判断为可读性差,所以我觉得这些“伪原创”可能是自作聪明。

评论模块基本不用。你到底要不要?

是的。评论模块头疼的是东西都是垃圾评论。通常真正发言的访客很少,垃圾评论很多。他们整天和营销软件较劲。下面是我体会到的一个方案,可能对收录有帮助(没有根据,只是猜测):

保留评论框,但禁止评论。所有评论都是你自己的网站程序生成的。前面说过,搜索引擎可以分析自然语义,其中一个重要的能力就是情感判断。搜索引擎会计算每条评论的情感值,无论是正面还是负面,具体倾向是%还是%。如果评论表达了积极的情绪,可以给你的文字加分,否则可以减分。至于如何自动生成正面评论,就让八仙漂洋过海各显神通吧。

这是社交网络发展后的必然趋势,通过这种方式来体现一个页面的用户体验。同样,还有分享,赞等。原理差不多。

绿萝算法之后,外链还有用吗?

有用。参见搜索引擎三定律的相对性定律。既然是法律,就不会改变。谁的内容被引用的多,谁就是权威。在主动推送出现之前,外链应该算是蜘蛛了解一个页面内容的第一渠道。

外链一定要是锚文本或者裸链吗?

不是,搜索引擎肩负重任,试图找到真正有价值的东西,剔除那些没有价值的东西。所以有可能你直接提交的链接没有被收录,你只是在别的地方发了一个纯文本的网站,被它发现了,加分了。

除了锚文本和裸链,还可以以关键词+URL的形式发送纯文本。这样网站前面的关键词就会自动关联到网站。

还有,有些链接虽然添加了nofollow属性,但是在百度计算外链的时候会被计算。

包含和指数有什么关系?

意思是蜘蛛已经被抓取分析过了。表示内容在经过索引蜘蛛分析后被认为是有价值的。只有已经进入索引的内容才能出现在搜索结果中并显示给用户。也就是说,只有索引的内容才有机会带来流量。

古井-- : 回复

作者:徐州百都网络 | 来源: | 发布于:2022-02-23 10:25:45