纯采集站也可以很滋润。
我是一个纯收藏站长。下面的总结有些是关于SEO的,有些是关于采集和运维的。都是很基本的个人观点,仅供分享。请分清好坏,从实践中获取真知。
一个纯收藏站长的SEO,收藏,运维总结,SEO推广
原创还是收藏?
当然原创是好的,因为百度是这么说的。人是裁判。
为什么我创作了很多原创文章,还是没有收录?被收录了还是没排名?
一个搜索引擎,其核心价值是为用户提供他/她更需要的结果。搜索引擎有网民的统计需求,即使你是原创,也有可能被搜索引擎忽略,因为它不想在无意义的内容上浪费资源。
对于网民需求量大的内容,要更多更快的收录。但是因为收录内容多,即使你是原创,也可能很难挤进排名。
搜索引擎通过什么来识别网民的需求?
关键词。当每个人都在搜索一个关键词的时候,说明他/她对这个词相关的内容有需求。而且,使用搜索引擎的人,通常都有问答和搜索查询。当然,搜索引擎内部必须有一个庞大的分析系统来准确定位这些需求。详见百度指数。比如搜索的关键词是“手机”。很可能你是想买手机或者想查某款的价格,或者你只是想下载漂亮的壁纸。但是如果你想要壁纸,会有一个更准确的关键词“手机壁纸”,会以下拉框或者相关搜索的形式呈现。
如果原作好,为什么要收藏?
原创虽好,但只要方法得当,收藏效果不会比原创差太多,甚至会比没有掌握方法的人好很多。
由于精力有限,原创很难保证大量的长期更新。如果雇了编辑,投入产出比可能是负的。
市面上那么多收藏家,应该用哪一个?
每个收藏家都有自己的独特性,所谓存在即合理。请根据自己的需求选择。我的采集器是我自己开发的,开发过程中考虑了以下几个方面。其他收集器也可以用作参考:
。直接提供大量分类关键词。这些关键词是百度统计过的,有网民需求的词(百度指数),或者这些词的长尾词,来自百度下拉框或者相关搜索。
直接根据关键词进行采集,智能分析网页文本进行抓取,不需要自己编写采集规则。
。捕获的文本由标准标签清理,所有段落都标有
标签,乱码将被删除。
根据收集的内容自动映射图片,图片必须与内容高度相关。这样代替伪原创,不影响可读性,文章图文并茂,让原著提供的信息更丰富。
正文内容中的关键词自动加粗,要插入的关键词也可以自定义。但是没有所谓的影响可读性的“伪原创”功能,比如句子重排、段落重排。
可以直接用关键词及其相关短语作为标题,也可以抓取目标网页的标题。
。微信文章可以收藏。
无需触发或挂断。
。整合百度站长平台主动推送,加速收藏。
不同的网站程序,比如Dreamweaver,WordPress,dz,zblog,Imperial cms或者其他,是如何影响SEO的?
理论上没有影响。因为搜索引擎不知道你是什么程序,或者可以通过一些规则来识别,不可能因为程序本身的差异而影响其判断。
什么会影响SEO?答案是模板。基本上,这些程序有一个模板机制。同一个程序可以输出不同的页面,不同的程序可以输出相同的页面。这是模板。模板确定之后,你的每一个页面都会按照这个框架输出,也就是整个html结构已经确定了。而这个html正是搜索引擎应该重点关注的。它必须从这个html中获得它想要的信息。所以,一套好的模板很重要。
模板设计需要注意哪些细节?
。重量结构顺序。在整个页面的html中(注意是html,不是显示的布局),位置越高权重越高。由此可知,三个标签“标题”、关键词、描述,因为在前面,所以权重较高。第二个就是平时导航,基本上比较高,权重也很高。再次,是文章的标题和正文。这个是按照html的前后排序的。
因为搜索引擎首先要遵循WC标准,一些原本由WC定义的标签被用来表示重要信息,所以权重自然高。比如特别是H,用来表示当前页面的重要信息,一般每页只能有一个标签,其权重估计相当于标题,通常用来放当前页面的标题。当然,为了提高主页的权重,也可以使用H来放置logo或者主页链接。另外还有em、strong等标签,用来表示强调。一般认为强权高于tag,也是加粗功能。但是,我们认为从SEO的角度来看是没有权重提升的。
。css或js代码通常对搜索引擎没有意义。尽量用单独的文件存储,或者如果允许的话放在html的末尾。
网站结构规划需要注意什么?
。URL设计。URL也可以包含关键字。比如你的网站是关于电脑的,你的网址可以包含“PC”,因为在搜索引擎眼里它通常是“电脑”的代名词。网址不要太长,级别尽量不要超过级别。这就够了。
栏目设计。列通常与导航相关联。设计的时候要考虑网站的整体主题,用户可能感兴趣的内容是什么,栏目名称是网站的主要关键词,这样也方便使用导航的权重。
。关键词布局。理论上,每一个内容页都应该有其核心关键词,同一栏目下的文章应该尽可能以栏目关键词为主。一个简单粗暴的办法就是直接用栏目关键词的长尾词。
动态、伪静态和静态哪个更好?
这个不能一概而论。建议使用伪静态或静态。两者的区别在于是否生成静态文件,URL格式是否是动态的。生成静态文件本质上是为了加快访问速度,减少数据库查询,但会不断增加占用空间;伪静态仅通过重写URL来修改URL。其实每次还是要经过程序操作,查询数据库,输出页面,对于加快访问速度完全无效。动态和伪静态的唯一区别是URL带有问号和参数。
所以只要注意两点:网站打开速度够快吗?需要节省服务器空间吗?
不同的网站程序可能有不同的数据库操作效率。一般来说,如果内容页面数量小于10000,那么页面打开速度相对较快,数据量较大,达到10000、100000甚至更多,通常需要考虑静态化。
有哪些提高访问速度的方法?
。上面已经提到的统计化。
通常很多网站模板里都会有随机调用的文章或者类似的板块。其实对于数据库来说,随机性是一个很重的负担,模板中要尽量减少随机文章的调用。如果不可避免,考虑从数据库进行优化。对索引字段进行排序通常比没有索引要快得多。
。放不经常修改的文件,比如图片,js,css等。,在专用的静态服务器上,并且可以将多个js或css尽可能合并到一个文件中,以减少http连接的数量。
使用各种云加速产品。对于普通网站来说,免费的百度云加速或者新云加速都是可以的。
文章很多,网站已经静态开启,但是每次更新整个网站需要很长时间。我该怎么办?
我的做法是使用缓存机制,这里只提供一个思路,可能需要自己二次开发。
网站设置为伪静态。当每个请求到达时,程序检查是否有相应的缓存html文件。如果文件是在几个小时或几天前生成的,我们认为它需要更新。此时,执行正常流程。程序查询数据库后,生成html,将其写入缓存文件,然后输出到客户端。
当下一次访问到来时,例如,当几分钟后对同一页面的另一次访问到来时,再次检查缓存文件时间。从时间上可以判断文件很新,根本不需要更新,所以直接读取文件内容输出到客户端。这样每个页面都可以自动生成,只有第一个访问者会觉得慢,后面的访问者就相当于静态访问,速度非常快。
如果是独立服务器,还可以考虑自动检测服务器的负载。如果负载已经很高,即使判断需要更新,也暂时不更新,直接输出。
图片参考远程网站好还是放在自己的服务器上好?
这也是各有利弊的。引用远程URL可以节省自己的带宽,但是很可能因为对方服务器慢,或者资源被删除,或者使用了防盗链,导致图片无法显示。如果下载到自己的服务器上,当然一切尽在掌握,但是图片会占用很大的空间,可能比一般的静态生成要大,而且如果访问次数多,图片会消耗更多的带宽。
如何优化网站的内链?
内链是百度官方推荐的优化方法之一,这个必须要做。通常情况下,文本中会出现一个关键词,在这个关键词上添加一个链接,指向恰好是这个关键词相关内容的另一个页面。于是诞生了一些所谓的优化技术,强制在文本中插入一些关键词和链接,进行类似于互推的操作。另外,为了提高首页的权重,到处放网站名称,做首页链接,以为这样可以提高目标页面的权重。但这些很可能适得其反,因为搜索引擎会统计每个链接的点击率。如果你在显眼的位置点了一个链接但很少点,可能会被判定为作弊。所以,请只对已经在正文中的关键词做内链。
段落重排、句子重排、同义词替换这些伪原创技巧好吗?
不好。因为搜索引擎是智能的,不再是简单的数据库搜索,而是可以自然分析语义(详情请搜索“NLP”)。任何一个语义分析困难的句子或段落,都可以判断为可读性差,所以我觉得这些“伪原创”可能是自作聪明。
评论模块基本不用。你到底要不要?
是的。评论模块头疼的是东西都是垃圾评论。通常真正发言的访客很少,垃圾评论很多。他们整天和营销软件较劲。下面是我体会到的一个方案,可能对收录有帮助(没有根据,只是猜测):
保留评论框,但禁止评论。所有评论都是你自己的网站程序生成的。前面说过,搜索引擎可以分析自然语义,其中一个重要的能力就是情感判断。搜索引擎会计算每条评论的情感值,无论是正面还是负面,具体倾向是%还是%。如果评论表达了积极的情绪,可以给你的文字加分,否则可以减分。至于如何自动生成正面评论,就让八仙漂洋过海各显神通吧。
这是社交网络发展后的必然趋势,通过这种方式来体现一个页面的用户体验。同样,还有分享,赞等。原理差不多。
绿萝算法之后,外链还有用吗?
有用。参见搜索引擎三定律的相对性定律。既然是法律,就不会改变。谁的内容被引用的多,谁就是权威。在主动推送出现之前,外链应该算是蜘蛛了解一个页面内容的第一渠道。
外链一定要是锚文本或者裸链吗?
不是,搜索引擎肩负重任,试图找到真正有价值的东西,剔除那些没有价值的东西。所以有可能你直接提交的链接没有被收录,你只是在别的地方发了一个纯文本的网站,被它发现了,加分了。
除了锚文本和裸链,还可以以关键词+URL的形式发送纯文本。这样网站前面的关键词就会自动关联到网站。
还有,有些链接虽然添加了nofollow属性,但是在百度计算外链的时候会被计算。
包含和指数有什么关系?
意思是蜘蛛已经被抓取分析过了。表示内容在经过索引蜘蛛分析后被认为是有价值的。只有已经进入索引的内容才能出现在搜索结果中并显示给用户。也就是说,只有索引的内容才有机会带来流量。
古井-- : 回复作者:徐州百都网络 | 来源: | 发布于:2022-02-23 10:25:45