页面质量——从常识出发

评估网页质量
1、满足用户需求。
2、多大程度满足用户需求:花费的时间、步骤、用户需要的信息是否可以明显的展现出来。

评估网页质量要考虑的7个维度
1、相关性:说的是不是一回事:和用户搜索词的匹配程度。(标题与用户搜索关键词的匹配程度)
2、抓主要需求:对于同一个关键词,例如搜索“大闹天宫”,可能是游戏,也可能是电影,不同用户可能需求不同,要站在多数用户的角度去考虑。(近期大家都要看电影,你却出来个大闹天宫的文章就不好了。)
3、内容丰富:专题比文章好。(修电脑、学教程,甚至是怀孕的知识,都想多知道点,总有适合你的)
4、能否真正满足:软件或者文档下载,最好是免费的、快速的达成目标。(前段时间在百度网盘好不容易下载个1G的压缩包,尼玛解压需要密码,我去51cto下载个文档还需要豆豆,当然人家是知名网站,可以理解。)
5、时效性:新闻事件对这个要求比较高,或者苹果5最新价格。(我搜索个“今天搬家日子好吗”,尼玛出来2011年的百度知道——-可见机会巨大奥……)
6、便捷性:获取我想要的信息需要花多少时间和成本。(我靠,找个信息,我点了十来下;而且网站广告多入牛毛)
7、权威性:有知名度的,有权威认证的页面质量往往会高。(寻医问药上说的答案比一个小网站靠谱)

再想说句:SEO还有网络营销,具有扎实的理论基础之后,从常识去发现、考虑问题,往往都会有意想不到的收获。去相信那些“砖家们”总结出来的谬论,还不如多看看原理、官方的说明。可能万变不离其宗能够更好的形容吧。

相关性

相关性

距离上一期已经1个多月,其实素材已经准备好,一直懒得动手。

为什么要做关键词的相关性,其实说到底是为了页面的外链。首先要摒除一些旧的概念,例如外链一定是从另外一个域名的页面链接过来的。

首先搜索引擎是用页面来排名而不是用网站来排名。只要不是这个网页自己链接到自己的,从另外一个页面的链接过来的都可以叫外链。

其次,外链的相关性是非常重要的。下面一段话来自Google网站站长指南:相关性

距离上一期已经1个多月,其实素材已经准备好,一直懒得动手。

为什么要做关键词的相关性,其实说到底是为了页面的外链。首先要摒除一些旧的概念,例如外链一定是从另外一个域名的页面链接过来的。

首先搜索引擎是用页面来排名而不是用网站来排名。只要不是这个网页自己链接到自己的,从另外一个页面的链接过来的都可以叫外链。

其次,外链的相关性是非常重要的。下面一段话来自Google网站站长指南:

请注意,我们的算法可区别自然链接与非自然链接。指向您网站的自然链接是当其他网站发现您的内容具有价值并认为其可能对访问者有所帮助时,在网络的动态生成过程中形成的。指向您网站的非自然链接是专门放在那里,使您的网站显得更受搜索引擎欢迎的链接。

只有自然链接对网站的索引和排名有帮助。

对于这段话,很好的解释了为什么外链多的网站有时候还不如外链少的网站排名好。

请注意,我们的算法可区别自然链接与非自然链接。指向您网站的自然链接是当其他网站发现您的内容具有价值并认为其可能对访问者有所帮助时,在网络的动态生成过程中形成的。指向您网站的非自然链接是专门放在那里,使您的网站显得更受搜索引擎欢迎的链接。

只有自然链接对网站的索引和排名有帮助。

对于这段话,很好的解释了为什么外链多的网站有时候还不如外链少的网站排名好。

随便写写最近的SEO和市场营销感想

随便写写最近的SEO和市场营销感想

最近网站SEO工作有可喜的地方也有可悲的地方。可喜的是初步SEO元素注入的网站终于Release上去,(之前一直是小打小闹),可悲的是百度权重还是没有恢复,流量还没动静。

网站排名越来越高,流量越来越大,用户越来越多,但是我们赚钱吗?恐怕这是许多网站面临的问题,网站的盈利模式,一直是互联网人关注的问题。 Twitter如今有上亿的用户,但是它依旧不盈利。开心网支撑了几年,终于和校内合并了,国内余下的SNS,都是苟延残喘的样子。他们没用户没流量没排 名吗?

Craiglist一个破破烂烂的网站,最近得到了N多的风投,越做越大。

有朋友做的外贸小站,一天销售万刀以上。

网站的盈利模式,包括不同阶段的盈利模式,都是相当重要的,有一个好的创意,也需要有坚固的底盘来支撑这个好的创意。一个理想的企业产品发开路线:

产品->投向市场->盈利->投入研究开发->新产品。这样下去才能推陈出新,用老产品支持新产品的研发,等新产品盈利后再开发更新的产品。

许多公司和网站都在幻想自己能够像Facebook一样改变互联网,但是事实上做到FB这样的网站有几个呢?除非你是垄断,或者起步早,或者技术有 优势。并且这些因素只占一个还未必成功,但是大多数成功的网站都无非都是这些因素,比如百度的中文搜索:垄断+起步早。虽然技术方面不如Google,但 是在国内依旧是龙头老大。比如Google起步早+技术好+垄断,造就了它搜索界霸主的地位。

你的网站盈利吗?怎么盈利?如果你还在说:“等我流量起来了,一定会盈利”。那你也就离死不远了。

采集数据需要哪些技术

 

采集数据其实大学有教,不过可能是研究生的课程,并且可能也不能算一门课,只是一项技术。

采集数据需要哪些技术

  • http通信原理
  • html/css/js
  • 各种编码
  • 一门语言
  • 敏(YIN)捷(DANG)的思维

数据采集工具

很多人都会问我,”请问采集数据用什么工具好呢?”。这样的问题我都很难回答,例如抗日战争中解放军小米加步枪也能日军精良的装备对抗,你敢说小米加步枪是无敌的吗?工具只是把一些繁琐的操作简化了,但是解决问题是要抓到本质。本人使用的一些工具

  • 火车头:基本能解决80%的采集问题
  • Python以及各种库以及Shell:上面解决不了才用这个
  • Httpwatch/Fiddler/开发者工具:抓包分析
  • 一个能用文本工具(比如notepad++,UE等。windows的记事本不是能用的工具,谢谢。):简单的替换,检查数据正确性,转转编码等
  • 能快速搭建起来的Web环境,数据有时候直接入本地库,更加方便,有时候采集一些接口是js调用的,那可以本地搭一个然后采集本地

采集数据小贴士

说的会比较简略,但是都是实战经验,希望能给一时卡壳的朋友一点帮助。

  • \xXX,\uXXXXX这种都是javascript的转义,%XX是URL的编码,GBK和utf8编出来是不一样的(感谢zero大神指点)
  • 能采集js的就不要去采集html
  • 如果PC版本的页面很难分析,试试wap站或者移动站
  • 遇到页面html不完整的网页用不了xpath,可以找找自动补全html的库,比如python的BeautifulSoup。C#的html parser
  • 例如你要采集www.xxx.com的很多网页,可以从sitemap入口,具体方法可以查看根目录下的robots.txt,或者试试根目录下 的sitemap.xml,再不行就在google中搜索site:xxx.com filetype:xml或者inurl:xml。
  • 使用火车头采集完保存文件的话,如果数据量大,千万别执行保存的步骤,直接用数据库工具(例如navicat)直接导出数据库。(时间可以差10000倍…)
  • 网上的免费代理列表=付费的http代理列表<肉鸡<VPN<自己买VPS搭($$)=ADSL拨号
  • 例如http://www.tyseoer.com/,你只想匹配www.tyseoer.com,怎么办?试试零宽断言。

你不得不知的大型网站SEO策略

胡勇

在搜索引擎优化中,SEO策略影响到最终的优化效果。SEO策略不管对中小网站还是大型网站都是重要的,而对于大型网站,制定一个好的SEO策略尤为重要,否则,你会漏掉很多细节,很多时候,细节就是决定成败。

第一部分:关键词分析

关键词分析是所有SEO必须掌握的一门功课,大型网站虽然有海量的数据,但是每个页面都需要进行关键词分析,除了单独的专题页面外,一般每个层次的页面,都需要有专门的关键词。除了SEO之外,策划、编辑也需要具备一定的关键词分析能力。

关键词分析的基本原则:

1、 调查用户的搜索习惯:这是一个重要的方面,只有了解用户的搜索习惯,才能把我用户的搜索需求,用户喜欢搜索什么?用什么搜索引擎?等等

2、 关键词不能过于宽泛:关键词过于宽泛会导致竞争激烈,耗费大量时间却不一定得到想要的效果,并且可能降低了关键词的相关性。

3、 关键词不能过冷:想想,没有用户搜索的关键词,还值得去优化吗?

4、 关键词要与页面内容保持高度的相关性:这样既有利于优化又有利于用户。

如何挖掘关键词?

· 百度搜索风云榜

· 百度下拉框提示

· 百度相关搜索

· 百度指数相关检索词
如何选择关键词?

首先要对关键词进行竞争分析。然后从多个关键词确定最终的关键词。

· 关键词类型—是导航查询类的词竞争性最强;信息查询类的词竞争性较小;交易查询类的词竞争性较强。

· 关键词搜索量—关键词的搜索量并非越低或越高越好,而要做具体的分析。

竞争对手分析

· 网站权重—网站权重越高,竞争度越强。

· 页面权重—页面权重越高,竞争度越强。

· 页面类型—首页的权重高于频道页,频道页权重高于内容页。

· 百度推广数量—如果百度推广数量过多,会抢走过多的搜索流量,这样的关键词能导入到自然搜索结果的搜索量会大大降低。

· 百度品牌专区等自有产品—百度自有品牌数量过多也会抢走过多的流量。
如何建立关键词库?

1. 抓取竞争对手网站的关键词,并根据行业和自己的分析,去研究一下行业的关键词都有什么类型,并且都有什么样的关键词。

2. 选择一批基础关键词,给每个词设置好不同的分类。
具体的关键词数量要根据行业而定,基本上,每个类别都要选择几十个关键词吧。如果行业规模搜索量在几十万以上的话,总共选择的基本关键词应该在至少几百个的级别。

3. 根据基础关键词用百度推广跑数据。就是把我们前一步选择的所有关键词,用百度推广的关键词工具进行搜索。然后将数据导出。注意:数据导出时需要精确匹配的类型。

4. 根据数据结果,填充基础关键词。在搜索和导出数据的过程中,我们可能会发现在之前基础关键词库中漏掉了一些重要的词。这时,需要把这些词添加到基础关键词库中,再重复第3步。

5. 制成一个完整的未加工的数据表。完成了第四步之后,我们会得多很多的未经加工的关键词数据,或者就是直接说是excel表格。我们需要将这些所有的excel表格中数据汇总到一个表格中。

6. 手动调整所有数据的分类,利用Excel筛选功能然后手动的给每一个关键词选择一个分类,就是新增一列分类的数据。在这个过程中,可以利用筛选功能,来提高效率。这是整个过程中最为繁琐和复杂的过程,我曾经花了将近60小时,梳理出了一个3万多个词的,总搜索量将近200万的关键词库。

7. 大功告成。给每个关键词填好分类之后,你其实就可以按照分类来查看每一类关键词的特点了。这样就具有真正的分析价值了。

第二部分:页面逆向优化
为什么要做逆向优化?因为在大型网站中,页面的优化价值一般不同于中小网站。考虑到各种综合因素(例如品牌、页面内容、用户体验等),大型网站的页面优化价值大多数呈现逆向顺序,即:最终页 > 专题页 > 栏目页> 频道页 > 首页。

如何针对各页面进行关键词分配呢?通常情况是这样的:

1、 最终页:针对长尾关键词;

2、 专题页:针对热门关键词,例如“周杰伦”;

3、 栏目页:针对固定关键词,例如“音乐试听”;

4、 频道页:针对核心关键词,例如 “音乐”;

5、 首页:不分配关键词,而是以品牌为主。

在进行关键词分配后,我们可以在最终页中添加匹配的内链作为辅助,这是大型网站内链的优势。如果你有留心的话,你会发现,很多网站的外链都有几千条,但实际上,其内链就占了1/5.内链做得好,对于大型网站,效果非常显著。

第三部分:前端搜索引擎友好,包括UI设计的搜索友好和前端代码的搜索友好两点

1、首先来看UI设计的搜索引擎友好:主要是做到导航清晰,以及flash和图片等的使用,一般来说,导航以及带有关键词的部分不适合使用flash及图片,因为大多数搜索引擎无法抓取flash及图片中的文字。

2、然后是前端代码的搜索引擎友好:

a、代码的简洁性:搜索引擎喜欢简洁的html代码,这样更有利于分析。DIV最好,把CSS分离出去。

b、重要信息靠前:指带关键词的及经常更新的信息尽量选择出现在html的靠前位置。遵循逻辑规律。

c、过滤干扰信息:大型网站的页面一般比较复杂,各种广告、合作、交换内容以及其他没有相关性的信息比较多,我们应该选择使用js、i等搜索引擎无法识别的代码过滤掉这一部分信息。

d、代码的基础SEO:这是基础的SEO工作,避免html错误以及语义化标签。

第四部分:内部链接策略

为什么要强调内部链接策略?因为内链具有以下优势:

1、 大型网站海量的数据使内链的优势远远大于外链。外链的数量可能几千几万几十万,但是大型网站拥有成百万上千万甚至上亿的海量网页内容,如果用这些海量的网页做内链的建设,优势是很明显的。

2、 网站内的网页间导出链接是一件很容易的事情。

3、 提高搜索引擎对网站的爬行索引效率,增强收录,也有利于PR的传递。

4、 集中主题,使该主题的关键词在搜索引擎中具有排名优势。

在内链建设中,应该遵循以下原则:

1、控制文章内链数量:穿插于文章内的链接可以根据内容的多少控制在3—8个左右。

2、链接对象的相关性要高。

3、给重要的网页更多的关注:使重要的更有关键词价值的网页得到更好的排名。

4、使用绝对路径。

第五部分:外部链接策略

在强调大型网站的内链建设的同时也不能太忽视了外链的建设。外链的建设虽然没有中小网站那么重要,但是也具有很高的价值。通常可以通过交换链接、制造链接诱饵、投放带链接的软文等方法来建设外链。

1、 来看交换链接应该要遵循哪些原则:

a、链接文字中包含关键词;

b、尽量与相关性高的站点、频道交换链接;

c、对方网站导出链接数量不能过多,过多的话没有太大的价值;

d、避免与未被收录以及被搜索引擎惩罚的网站交换链接

2、 制造链接诱饵:制造链接诱饵是一件省力的工作,这使得对方网站主动的为我们添加链接。制造链接诱饵的技巧很多,但是可以用两个字来概括:创意。

3、 带链接的软文投放。指的是在商务推广或者为专门为了得到外链而进行的带链接的软文投放。

第六部分:网站地图策略

有很多大型网站不重视网站地图的建设,不少大型网站的网站地图只是敷衍了事,做一个摆设。其实网站对于大型网站是很重要的,大型网站海量的数据、复杂的网站导航结构、极快的更新频率使得搜索引擎并不能完全抓取所有的网页。这就是为什么有的大型网站拥有百万千万甚至上亿级的数据量,但是却只被搜索引擎收录了网站数据量的一半、三分之一甚至更少的一个重要原因。连收录都保证不了,怎么去做排名?

Html地图:

1、 为搜索引擎建立一个良好的导航结构。

2、 Html地图中可以分为横向和纵向导航,横向导航主要是频道、栏目、专题等链接,纵向导航主要是针对关键词。

3、 每个页面都有指向网站地图的链接。

Xml网站地图:主要针对Google、yahoo、live等搜索引擎。因为大型网站数据量太大,单个的sitemap会导致sitemap.xml文件太大,超过搜索引擎的容忍度。所以我们要将sitemap.xml拆分为数个,每个拆分后的sitemap.xml则保持在搜索引擎建议的范围内。

第七部分:搜索引擎友好写作策略

搜索引擎友好写作是创造海量数据对取得好的搜索引擎排名的很关键的一部分。而SEO人员不可能针对每个网页都提出SEO建议或者方案,所以对写作人员的培训尤为重要。如果所有写作人员都按照搜索引擎友好的原则去写作,则产生的效果是很恐怖的。

1、 对写作人员要进行反复培训:写作人员不是SEO,没有经验,不可能一遍就领悟SEO的写作技巧。所以要对写作人员进行反复的培训才能达到效果。

2、 创造内容先思考用户会去搜索什么,针对用户的搜索需求而写作。

3、 重视title、写作:例如虽然在搜索引擎的权重已经很低,但是不好的写作例如堆积关键词、关键词与内容不相关等行为反而会产生负作用。而Title的权重较高,尽量在Title中融入关键词。

4、 内容与关键词的融合:在内容中要适当的融入关键词,使关键词出现在适当的位置,并保持适当的关键词密度。

5、 为关键词加入链接很重要:为相关关键词加入链接,或者为本网页出现的其他网页的关键词加入链接,可以很好的利用内链优势。

6、 为关键词使用语义化标签:

第八部分:日志分析与数据挖掘

日志分析与数据挖掘常常被我们所忽视,其实不管是大型网站还是中小网站,都是一件很有意义的工作。只是大型网站的日志分析和数据挖掘工作难度要更高一些,因为数据量实在太大,所以我们要具备足够的耐心来做该项工作,并且要有的放矢。

1、 网站日志分析:网站日志分析的的种类有很多,如访问来源、浏览器、客户端屏幕大小、入口、跳出率、PV等。

跟SEO工作最相关的主要有以下三种:

a、搜索引擎流量导入;

b、搜索引擎关键词分析;

c、用户搜索行为统计分析

2、 热点数据挖掘:我们可以通过自身的网站日志分析以及一些外在的工具和SEO自己对热点的把握能力来进行热点数据的挖掘。

热点数据的挖掘主要有以下手段:

a、把握行业热点,可以由编辑与SEO共同完成;

b、预测潜在热点,对信息的敏感度要求较高,能够预测潜在的热门信息。

c、自己创造热点,如炒作等;

d、 为热点制作专题

第九部分:为关键词创作专题

除了最终页面,各种针对热门的关键词所制作的专题应该作为网站的第二大搜索引擎流量来源。我们在对热点数据进行挖掘后,就可以针对这些热门关键词制作专题了。制作的专题页的内容从何而来?我们一般通过程序实现对应关键词相关的信息进行筛选聚合,这样就使得内容与关键词高度匹配,为用户、为搜索引擎都提供了所需要的内容。

当然,仅仅建立一个专题而没有辅助手段是很难保证专题的搜索引擎排名的,我们可以通过文章内链、频道页推荐、或者最终页的专题推荐来获得链接达到效果。

1、为热点关键词制作专题

2、关键词相关信息的聚合

3、辅以文章内链导入链接

一般来说,对于一个门户型网站,按这类思路,详细的贯彻下去,落实到位。很快就可以达到预期的效果。

 

喜欢此文章请关注微信公众号【huyongseo】或者点击右上角转发。

将SEO整合入整个项目过程

当网站经常更新修改,很容易造成一些对SEO有巨大影响的错误。有时网页的标题只包含了公司名称;又或者是文件从测试服务器上COPY过来时,把noindex标记也一并带来了(夜息注:我就遇到过这样的悲剧。);再或者说你发现某个分类下的链接都是nofollow的。错误随时会发生,但是将SEO理念注入整个网站项目能帮助你及时发现这些错误。

需要整合SEO工作的,有下面四个环节:

l 计划阶段

l 设计阶段

l 开发阶段

l 运营阶段

(夜息注:似乎一个网站项目的过程全包含在里面了,可见想要做好SEO,必须步步为营。)

想要做好SEO,那最好的解决方法就是在每个阶段开始的时候,就让SEO工作者加入其中,或者在让SEO参加会议讨论。让SEO人员对整个计划给出SEO方面的建议,比等到项目完成了,再让SEO提出修改方案要高效率得多。尽量让项目在一开始在SEO领域就朝正确的方向走。

(夜息注:一般公司对SEO不怎么理解,以为只是一些代码方面的小修改,其实SEO是富含技术含量的全局化操作。)

计划阶段

将SEO加入这个阶段是非常重要的,它能够为整个工程设定一个期望值。当你们投票决定是否要开发一个新功能或者重新设计网站,再或者增加一些新的内容时,如果你有SEO的思维,你就能对整个项目做出较大贡献:目标群体期望和项目功能是否一致? 如果这是一个商业开发项目或者合作项目,你如何调整平衡SEO的利益?

如果你的SEO工作没有与整个项目组脱节,计划阶段是开展SEO好机会。为项目组的每个人提供一个SEO的提醒列表,让他们在开展自己的工作时,能够提醒他们将必要的SEO思想融入到工作中去。

设计阶段

在设计阶段,你可以在网页线框图转交到设计或开发人员前进行检查,以确保SEO的元素融入到整个网页中。在程序员们把代码都写好之前,把一个h3标签换成h1标签要容易的多。更为理想的是,你能够和整个前端团队一起工作,在需要代码修改时,在旁边作出注解好让每个前端同事都注意到。把需要SEO修改的东西列成表是一个好注意。

(夜息注:以我个人工作的经验,把SEO需要修改的地方列成表并且进行追踪跟进是一个高效率的行为,因为你不知道哪天你自己或者你同事就会忘记其中的一条或者多条。)