' D7 o: c+ L2 T- f$ p) q# q, J- f 百度互联网创业俱乐部搜
# M( w) v1 g8 I, m索引擎优化指南 , z* ?0 ~6 r. n
版本号:V1.0 " H8 k8 B; q+ Y2 ]
@ Baidu 2010 % p1 }3 H1 N# j7 E
2 百度搜索引擎优化指南
0 b5 U4 V) B+ I$ n+ [& P+ P" e) d3 R3 f9 T) ]! L/ q/ {1 }
( g p$ J4 p) p. a
& Q- T- l: ~; b5 t
前言 5 U8 @& M- v+ R' ~& d: Q$ P
SEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎 3 I$ |: o3 K! t/ t/ y
自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为 , J# R) o- H, V9 Y) c
的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search
& {$ \& T3 G$ X0 ?0 M& ^engine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。
6 _$ i$ `, i! ?+ I6 {2 ?/ s毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种 2 u; R9 e0 a; `0 m% ]6 t9 r
对立源于两方面:
: x5 @, U4 m' R( n5 a一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否 4 Z$ d3 ^- m1 r# F; F* Q6 d
符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的
1 Q* S& c& p0 n4 \5 D) s严厉打击。 , R6 Y# ?4 E& {; y4 J% t
另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立 & \8 f0 P9 d8 o+ s: g
的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益 $ ~$ w2 Y) P& w9 Q2 h4 N( K# E5 Z0 V
就是不可调和的。
2 f0 e2 H! a# p5 B$ q7 S但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的
7 h8 @1 F2 @- X0 K地方的:
5 J V# |* P+ }首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源, 8 X2 Q H5 k& U( u$ ?1 w# k
是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起 3 @3 n- @; d7 u6 T
这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改 ; p6 ]% l+ k8 {0 x
善用户搜索体验。
' H0 B+ J" Q" T/ s4 b其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市
8 _' ?7 ]3 c& `; H* l/ d场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以
. y% R, b5 J( i8 C2 w8 k扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。
7 F" {3 W( N6 T" V基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更 9 r3 z5 t/ v7 K9 d- I+ M1 V
加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百
. v' v" l! y, E' I+ _- q0 p度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。 6 U8 I( w+ u$ t( \3 Y; t
我们先来看一下过去的问题所在。
& U- a* O/ w4 V% I2 ^" R. g(1) 黑帽SEO 大行其道,占据了SEO 主流话语权 ! o3 L: T) s0 c! w* C" {
黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺
. |2 v# D% f( @陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害 5 i) z( |5 J r
3 百度搜索引擎优化指南 , K0 v+ f. T3 f# x# Y
用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短
+ l8 T# s' { t* x; |$ V8 `期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领 # ?% i. }; A' V! \3 m- q0 \
域,破窗效应是非常明显的。 ( M3 W% v/ d& I3 R5 n% H
很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态
! M" h/ p' D9 ~的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则, " n# w* Y/ w( P4 L; z: S' e
就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。
, Y+ `/ Z" O* X% x0 C对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环
9 R. q) Q5 R# P' I境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽
7 n8 j4 a7 K4 c- |. SSEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆
X: S0 L; L7 f, ? f论氛围。这是我们必须要去扭转的。 9 V4 Z4 j0 `0 K) a% j1 q- o; w
总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此, - R0 J9 `* b9 p; A$ o
将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑
" ^3 c' ~4 C: @; X+ C: A3 \! j帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。 2 V/ t* s& G$ |, q
(2) 白帽SEO 行为得到的指引不够清晰
0 K3 a7 Q4 s) M所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好, $ L- F5 B+ q* {
并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的
$ b: i) j+ I+ i0 M8 r行为是推荐的。这导致很多白帽优化心存顾虑。 & ~9 L7 R8 ?. x: U: i1 Q: f
正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围,
8 \/ y% U% q0 l# d" _ ?以使SEO 行业,有更加良性的发展。
* v/ {! C: ^6 T- U9 x9 K需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完 & ?' k( S* X5 q6 m' ^
美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见,
8 [& d+ b: l- [ s) |9 r. a2 K来不断的完善这一指南。
( x. j \* \& K& W+ r, c1 L4 o4 百度搜索引擎优化指南 8 r; v' C6 l$ ^/ K: d. ]
目录
; X8 \7 O' X; u& q7 I; I前言.. 2 . e4 l- k" j6 Q6 g
目录.. 4 9 l& }) a# {. @; Q Y
1 前期准备.................................................................................................................... 5 & G- C6 G6 V* U0 p0 p% l
1.1 域名注册.................................................................................................................... 5 . [" Y; J @$ f a, A! b
1.2 服务器、空间租用..................................................................................................... 5 & g; Y( t1 y; N" |7 z: {8 y
2 面向搜索引擎的网站建设.......................................................................................... 6 - @" u5 E3 ?5 H
2.1 良好收录.................................................................................................................... 6
+ _+ p: u- d& F2 T9 d' [* M2.2 良好排序.................................................................................................................. 11 5 T% M. y6 m9 A: l0 F
2.3 良好展现.................................................................................................................. 13 ! X1 d( v6 e6 C( C2 t T$ T$ q2 w/ m1 l
3 网站运营.................................................................................................................. 15 * t g( I. Z5 y( k o& D. u
3.1 目标=转化率............................................................................................................ 15 $ V" Q8 a' v, U
3.2 搜索引擎流量分析................................................................................................... 15 6 W* v$ P; I3 V" A, B9 U3 [
3.3 网站信任度.............................................................................................................. 16
) ?9 b' R4 m$ B2 b" ], a3.4 不断强化品牌概念................................................................................................... 16 3 K2 ^% R+ d5 g$ B0 c" c% N
4 作弊与惩罚.............................................................................................................. 16
' [/ P; O0 Y( s- a4 U" h; Z4.1 百度如何定义作弊................................................................................................... 16
3 |. }$ E* L2 J% D8 g6 x4.2 作弊会受到怎样的惩罚............................................................................................ 18 / Z3 l* a5 B( M# V8 i# P/ \+ P r
4.3 改正后能否解除惩罚? ............................................................................................ 18 % A6 h- A r/ u( N% Y X2 c
5 联系与反馈.............................................................................................................. 18
% @/ l( l; X2 m+ s6 关于百度的十万个为什么........................................................... 错误!未定义书签。 4 u+ P& P7 L( x+ B
5 百度搜索引擎优化指南
' r1 [8 a! k% F9 j; D, m6 d1 前期准备
/ r" C. H8 z* R; Y( Q/ L* n/ [域名和服务器空间是网站建设的基础。
. A1 b+ a5 w$ P1.1 域名注册
+ l' V+ A1 V2 M, m& j& B1 h* V域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注 7 |0 p) l" L1 e) C
册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户 8 v$ ]$ f2 O# G% F6 y: C, ?
推荐。 3 J* D5 i' U' k- U
(1) 域名尽量简短,越短的域名,用户的记忆成本就越低 9 M' K E, R9 z! }! i
(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如 " a' h3 ^. u" A( u
使用公司名称、商标、网站名称或者公司产品等信息来选择域名 7 ~" `: h1 K) X
(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用
/ v; s. N" o0 a) V户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可
! c) Z' h+ A- L" ?' W+ u能会让用户产生不信任感,增加用户的判断成本。
$ P4 u8 j' y3 v0 P1 N' c* C1.2 服务器、空间租用 : X0 Z) {; T" n: H5 Z! k% d( S3 F
服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建
1 I8 c5 {- }7 g* o& z2 B议选择服务稳定、速度快的服务器或者空间。
! P! j R2 G* E0 i- F) K" U(1) 选择有实力的正规空间商
0 g _; Y4 g3 Q+ g1 ]服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力 E& U1 V' A& F8 t
提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉 # a' d+ y' [# R9 o3 _8 r+ q& q
Baiduspider 的抓取,导致网站无法被百度网页搜索收录。 y- K3 Q9 w! |8 K( a+ v6 A$ X
(2) 保证用户的访问速度和稳定性 # w' z* U: \- h0 q. \" a8 R
(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器) . b7 i. s6 {1 s
通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳
) b) l9 Z* f0 W6 J& }2 W, q定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可 & n1 ^' c( P; L/ A5 d7 p
以根据自己的需求来进行合理的选择。
6 n/ p; f1 W2 `+ L. @(4) 根据用户群分布选择接入商 [) v" F/ b& p" U& ~& S/ p
由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通
& k2 X8 @( e: m+ ~6 O, V访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在 , }) T* O9 K9 ~7 M
全国,那就选择一家互通处理的比较好的接入商。 ) i- @* R- W( l# Z8 ?5 [
6 百度搜索引擎优化指南 3 ]4 h2 a; M2 e! J/ t
购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
( o1 ~1 I* J0 i$ K* T5 o2 面向搜索引擎的网站建设
, P6 o7 Y" U) v* F3 `7 U/ j p搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,
% P3 t! A$ C3 @也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的 2 g: G- J- x8 _$ V
优化,同时也会让用户受益。
7 o0 H4 T/ l+ ~" J/ R面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内 0 X& [3 y S- f
容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简
e, F+ n! w! R4 g单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。
d2 R0 o( q5 y' Y% ?* ^( _2.1 良好收录
/ F4 X6 H1 {) [: c: v+ T" M2.1.1 机器可读
, }* H; W; b- a9 {. F0 J百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。 ; m/ A5 P- z5 A- ?2 o( m: G
目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、
/ |( f G6 L0 s% g图片中的文字,百度无法识别。 A; ~5 H+ p9 i7 _# S
建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎 * _) u5 b5 }) H/ y1 q
暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、
+ Q& ]5 D4 T0 N8 O* Z# H" eJavascript 中包含链接指向的网页,百度可能无法收录。 7 | D& O. S# F6 p+ s0 T+ L" L1 \$ W2 k
冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接 2 m6 F$ `: i' }. V* f8 Z* G$ I
冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页
: E9 t& t6 }' Q# i( \2 N使用文本链接指向文字版
& z4 e- x, i1 M" ]/ M- M- ]冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看” 5 n* s/ p! b( Q: a* v! ?) A
到的导航及正文内容放到Ajax 中 * P; H5 \$ \' |6 ?! Y
冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃
. B( }) B2 i3 r" ~2 [6 \( _我们建议: $ [3 q2 C' q% G
7 百度搜索引擎优化指南 : V8 y0 a: X7 [4 @" T6 @8 l
上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对
t0 f t6 n: D& _5 L( T' V2 G搜索引擎来讲,这个网页没有任何内容。 * Y* g% ~. k4 J, k7 M: M8 l
2.1.2 网站结构 + ~1 t( c ?" v) f4 R/ v
网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的 / N( a- t+ k) B! D$ i( p! ?. b
内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。 " E) r+ l* X g" f- C
网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章
* ~& o/ p+ o% d% ?" T1 A页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通 6 z, J% G6 W/ X; Z
内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应
|0 o% O/ I0 M- w对。
: s$ a: P7 X5 m* y& Z5 |0 e理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理
7 \& `* c) n2 o起来,会更简单。
9 }+ w! H- L# Y0 t; c同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相 : M, ^# T/ {" f$ `- b
关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页 0 [, c) x/ ?+ f( E) A
有到上级频道以及首页的链接、内容相关的网页间互相有链接。
5 ^3 ^) c6 p& P2 i) i0 J' c网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。 9 a% |' w: s+ m% S, j
总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。
% k1 c4 D+ F4 \- p* K9 \冘 确保每个页面都可以通过至少一个文本链接到达。 % J" t! V- I% C
冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。 3 O2 ^2 K( u; T8 o& V2 i5 p/ N
我们建议: 2 O, \6 ^5 Z4 F2 G1 N, L# |
8 百度搜索引擎优化指南 ( C) f* p6 {( [6 h2 M" Q- y# |
冘 合理分类网站上的内容,不要过度细分。
4 f# ~+ f! Q% [6 \; i; j网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助 , J6 g0 H2 S/ X: `7 d
搜索引擎更好的了解网站的结构。 * F& d* D5 J. Y# _' t6 H
冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎 / B! l3 I9 V3 z
方便的定位网页在网结构中的层次。
1 B( a0 b, p: P' R$ s' X0 r) f6 u4 D0 V u冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网 + @7 p( F* W) S) I
站首页> 频道> 当前浏览页面 . u9 f3 A( M( d, ?9 b' i+ ~7 V
通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上
! J/ m4 h2 ^* o5 S5 t: m一级频道或者首页也很方便。
* W2 @5 J1 i5 T% C3 G9 i) o冘 导航中使用文字链接,不使用复杂的js 或者flash
- O. G( x% l# ]; U0 k冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么
7 k, E; ]7 r' J2.1.3 子域名与目录的选择 % }* b- L { W R( ]; B
选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大 6 G6 P0 v5 K" {# U
的影响。
" n4 d8 A2 y' f5 E0 C' {- o冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频
9 } I/ K( m" e道下积累了足够的内容,再转换成子域名的形式
_1 c( Z }0 M g/ K一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的 2 o5 ?$ Q/ |1 v7 x4 n9 y2 O9 g
网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的, $ w3 A: L7 K: z7 p2 A
子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。 6 v( B; g/ R5 _$ u
在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在
2 r" p) O' z, n" C( q9 A& v9 f2 `搜索引擎中获得更好的表现。 $ u/ c& v# d- v- m
冘 内容差异度较大、关联度不高的内容,使用子站点形式 " S- n* _7 _; y- x, @8 L; m) D0 X
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误 / W' X9 Z; }" y" n5 c g2 X
的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点 , C' H# ?6 w e9 z( I
的主题。
5 t2 w; s0 e# H1 @+ h7 C5 G, x冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b.
' s9 j2 \ o* S0 bexample.com 访问
! M/ |; ]8 d3 [- G子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理,
) l& I' u k9 R. V3 B/ g9 b我们建议: & H m6 _3 x5 w! H
我们建议:
! i1 L" {$ t7 [* w9 百度搜索引擎优化指南 , h& o. i' `0 ]& g) }2 q
保留的url 不一定是正常域名下的。 2 ^! Y5 e( S2 m4 @% u& H2 Y
冘 不要滥用子域名 , @. [, v( D) t4 ]6 t/ N. @
无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|