第四章:SEO搜寻引擎最佳化的基础开发与设计 (上)

    SEO基础 wuya 43次浏览 已收录 0个评论

    因为目前搜寻引擎无法完全解读网页内容,所以网页设计时需要以搜寻蜘蛛容易索引方式製作。对搜寻引擎来说,它们看到的网页跟我们并不相同。在这章节中,我们将把重点集中在网站的技术层面上,这样的网站架构,在搜寻引擎与用户的眼中才会相似。可以把这个章节分享给程式设计师,前端工程师,和网页设计师,让所有参与网站製作的人都有相同知识。

    要製作能被索引的内容

    为了在搜索引擎列表有更好的表现,重要的内容请使用HTML格式。就算搜寻引擎蜘蛛抓取的技术越来越进步,Flash,Java,以及其它非文字的内容通常还是会被蜘蛛忽视或认为不重要。若想让内容如实呈现给访客,最简单的方式就是使用HTML文字给搜寻引擎抓取。但是,更棒的方式是呈现给搜寻引擎的同时又保有视觉设计的网站。

    以下为几种方式:

    1.图片用Alt属性。指派gif,jpeg或png格式的图片”alt attributes” in HTM为了便于搜寻引擎解读,在这些图片加上一些文字叙述。
    2.做网站内导航性质的搜索框与内部连结。
    3.为Flash与Jave Plug-ins增加文字叙述版本。
    4.提供视频与音频的文字複本,以便于这些说明文字被搜寻引擎索引。

    「我的网页无法被收录。我为了Juggling Pandas做了一个Flash,但却无法在Google找到它。发生什幺事了?」

    用搜寻引擎的方式检视您的网站

    很多网站在「内容索引」有着很大的问题,所以网页设计製作完成之后重複检查是必需的。通过检视工具,例如:Google’s cache(页库存档), SEO-browser.com, and the MozBar,您可以检阅您的网页内容哪些可以被搜寻引擎读取与索引。看看您目前开启的网页在Google是如何显示的吧?看看相同的网页在搜寻引擎与在您眼中有何不同。

    以下Moz用Juggling Pandas做例子:​
     

    哇!这就是我们的样子吗?

    使用Google catch的功能,我们可以发现Google所看到的 JugglingPandas.com首页并没有我们来的丰富,而这是因为网站的一些构造无法被搜寻引擎解读。

    以下Moz用Axe Battling Monkey Blog做例子:
     

    嘿!有趣的小游戏跑那儿去了?

    呜嗯……透过Google catch,我们可以发现右上方显示的网站真是空白的可怕。没有文字说明,也看不到小游戏。网页设计时,这个网站全部是用Flash建造,但很可惜的,这也意味着搜寻引擎无法索引到任何文字,更别说Flash小游戏。没有使用HTML,这个网站在搜寻引擎上的排名可是会非常难看。

    最明智的做法是除了检查文字内容,同时也使用SEO工具仔细检查网站在搜寻引擎的显示内容。不只是图片,下面即将叙述的「连结」也适用这样的做法。

    要有能被抓取的连结构造

    正如搜寻引擎需要抓取关键字来分类网站内容,网页也需要有正确的连结让搜寻引擎可以第一时间的抓到它们,所以拥有一个能够被搜寻引擎蜘蛛爬行抓取的正确连结构造非常重要。但也有许多网站会犯这致命性的错误,把连结建立在蜘蛛无法进入的地方,而这也使得网页无法被索引,隐藏在网络世界中。

    以下,我们用图片来示意发生这问题的原因:
     


     

    在上面的图片,Google蜘蛛已经爬到了页面A且看到了通往页面B与E的连结。但是因为不正确的连结构造,就算页面C与D很可能是这个网站里最重要的页面,蜘蛛还是无法爬向页面C或D(或着是说,蜘蛛有可能根本不知道有页面C和D的存在)。若Google蜘蛛找不到,这也代表着页面C与D并不存在,就算有再好的内文,关键字选的再精準,网页设计在美观,和再聪明的行销手法,只要蜘蛛无法爬行到,一切都是白搭。

    来解剖连结架构吧!
     

    ​​
     

    网页上所有可供点击,让访客从一个网页移动到另一个网页,呈现的形式包含图片,文字,或是其他物件,就是所谓的连结。而连结是网际网络中最基本的元素,网页设计上最常听到的词就是「超连结」。在上图中, “<a” 代表着连结的开始,而这连结会告诉浏览器(以及搜寻引擎)这个连结要去哪。在这个例子,这个连结要去http://www.jonwye.com。在这之后,访客可以看到的文字在SEO搜寻引擎最佳化的世界中称做锚点文字,用来介绍连结的目的地。以这个网站为例,网站的目的地是Jon Wye的客製化皮带,所以在锚点文字显示「Jon Wye’s Custom Designed Belts」,最后的“</a>”则是连结的结尾,用来防止页面上的其他语法与之相连结而产生错误。

    以上是一个连结的最基本形式,且这是搜寻引擎完全可以理解的方式。搜寻蜘蛛会知道它们须把连结放入资料库,且用它来计算网页的搜寻独立(Query-Independent)的变量(类似Google的PageRank),并根据结果分类索引。

    搜寻独立(Query-Independent)搜寻蜘蛛在索引后进而分类一个新网页前,会先以网站内的关键字与网页连结预估网站的重要性与价值,与用户的搜寻习惯是不一样的。

    来看一下网页无法被读取的常见原因吧!

    ● 网页使用线上提交表格
     

    若您的网站最初设计时是需要访客完成线上表格登入后才能够进入,那搜寻引擎可能就无法看到那些被保护的内容。表格的形式有可能是密码保护的登入页或是问卷调查。不管是那种形式,搜寻蜘蛛一般不会尝试去提交表格,所以任何经由表格登入才能够进入的页面,蜘蛛都不会去抓取。
     

    ● 使用无法剖析的JaveScrip连结
     

    若是您使用JaveScrip形式的连结,您会发现搜寻引擎要嘛不抓取,要嘛就是给崁入的连结很低很少的权重。若您想让蜘蛛抓取,请用标準的HTML连结替代(或着用HTML搭配)。
     

    ● 连结指向被Meta Robots tag或是robots. txt封锁的页面
     

    Meta Robots tag或是robots. txt两个都是网站管理员设定禁止搜寻蜘蛛进入特定网页的程式。但是要小心,虽然许多的网站管理员企图为了防止垃圾蜘蛛进入而使用这两个指令,但若使用不当可能整个网站都无法让蜘蛛进入。
     

    ● 网页使用Frames或iframes
     

    网页设计技术上来说,Frames与iframes形式的连结是能被搜寻引擎抓取的,但两者对于搜寻引擎来说都存在着对其组织与追蹤的结构性问题。除非您知道搜寻引擎如何索引与追蹤Frames所连结的网站内容的专业人士,不然还是别用的好。
     

    ● 蜘蛛不使用搜寻框
     

    虽然这跟上述警告的线上表单相关,但这太普遍了必须另外提出来。有一些网站管理员以为在网站内放一个搜索框,搜寻蜘蛛就会找到访客搜寻的内容。但很可惜的,蜘蛛不会使用搜索框找访客搜索的关键字,只要没做好网站连结,这样的页面就永远都被隐藏,不被抓取。
     

    ● 使用Flash,Java,以及其它的plug-in
     

    上面的例子中,在Juggling Panda网站内崁的连结就是最好的例子。虽然每只熊猫都是通往另个网页的连结,但因为蜘蛛无法利用这类型的连结格式通往其它页面,使的这些页面对搜寻引擎来说是隐形的。
     

    ● 网页拥有过多连结
     

    搜寻引擎在网页上只会抓取固定数量的连结。这个限制是为了防止垃圾连结与保护排名的正确性。若网页上有过多的连结,就有「不是所有连结都会被抓取与索引」的风险。
     

    只要你避免掉入这些陷阱,您就有个乾净,能被索引的HTML连结让蜘蛛能够简单进入的网站。

    Rel=”nofollow”

    Rel=”nofollow”可以用下面的语法:

    <a href=”http://moz.com” rel=”nofollow”> Lousy Punks! </a>
     

    连结可以有很多属性,搜寻引擎几乎全都忽视了,除了rel=”nofollow”属性。在上面的例子,加上rel=”nofollow”在连结内,代表着告诉搜寻引擎这个网站拥有不值得信任的内容,让搜寻引擎不要继续往下检索,避免网页权重被扣分。
     

    Nofollow,按字面上来看,是下达指令让搜寻引擎不要跟蹤这个连结(虽然有些还是会去跟蹤)。Nofollow属性一开始是为了帮助停止部落格,留言版的垃圾自动回覆和连结,但演变到了现在,变成了告诉搜寻引擎降低这个连结原本的价值。每个搜寻引擎对Nofollow的连结判别都有些微不同,但很显然的Nofollow的连结不会比一般的连结拥有更多权重。

    难道nofollow的连结不好吗?

    虽然Nofollow的连结与Follow连结相比较下并没有什幺价值,但它仍是一种可以配置多样连结的普遍方式。一个拥有很多对内连结的网站通常也有很多的Nofollow连结,而这也并不是一件坏事。实际上,Moz的排名因素分析显示,与排名较低的网站相比,拥有较多Nofollow对内连结的网站通常往往拥有较高的排名。

    Google

    Google声明在大多数的情况下,他们不会跟蹤Nofollow的连结,这些连结也不会被传递PageRank或锚点文字的价值。实际上,使用Nofollow连结促使Google把目标连结放在整体网页範围外。Nofollow的连结没有任何权重,只被当作是HTML文字(也就是说连结不存在)。儘管如此,许多网站管理人认为就算是从具有权威性的网站来的Nofollow连结,例如维基百科,仍然也是可提高自身网站信任度的。

    Google对nofollow的定义

    Bing & Yahoo!

    Bing, 提供Yahoo搜寻引擎技术,也曾声明它们的搜寻引擎蜘蛛会抓取网站内的Nofollow连结,但并不会包含其价值,也相对的对网站排名没有任何效果。

    Bing对nofollow的定义
     

    关键字的使用和目标锁定

    关键字对搜寻的过程十分重要,它是建构搜寻过程的基石与语言。实际上,关键字是整个资讯检索科学(包括网路搜寻引擎,例如:Google)的根基。当搜寻引擎抓取网页时,搜寻引擎会依据网页内的文字内容(关键字)做分类,而不是把内容全放在同一个含有25亿网页的资料库。所以搜寻引擎有数亿万个小资料库,而每个小资料库都是特定的关键字或词, 可以让搜寻引擎在最快的速度进行检索。
     

    显然的,假如您想让您的网页能在「狗」这个关键字的搜寻结果排名出现,最好确保「狗」这个关键字在您的网页是容易被搜寻引擎抓取的关键字。
     

    关键字的控制权(支配,主宰,控制,优势)

    关键字支配着我们怎幺传达自己的搜寻需求,以及如何与搜寻引擎互动。当我们输入查询的文字(词),搜寻引擎会依据我们输入的文字进行相关的网页媒合,而文字的排列顺序(”pandas juggling” vs. “juggling pandas”),拼音,标点符号,以及大小写也会提供额外的讯息让搜寻引擎检视并排列最符合的结果。
     

    搜寻引擎会衡量关键字在网页上呈现的方式来帮助判定这个网页的内容是否符合用户的查询。优化网页排名的最好方式之一是确保网页标题内有关键字,内文的关键字以文字的方式呈现,以及在metadata内包含关键字。​
     

     

    一般来说,只要您的关键字越明确具体,您越可缩小搜寻引擎的排名竞争,更可以提升更高排名的机会。上面的地图是广泛的字「书」,以及精準的词「双城记」的比较示意图。您会发现,被查询的文字越广泛,得到的结果很多;文字越精準,得到的结果相对的就越精,但同时,也越少网站与您竞争。

    关键字的滥用

    从开始有了网络搜寻,为了操纵搜索引擎的排名,有些人不断用错误的方式滥用关键字,而这包含把关键字「堆积」在内文,网址,Meta 标籤,和连结。不幸的是,这些方式都不会让您的网站更好,只会更糟。
     

    在早期,搜寻引擎评断网站与关键字的相关性时,看的是网页内关键字的出现频率,而不是关键字的使用的合理性。直到今天,虽然搜寻引擎仍然无法像人类一样的理解文字内容,但是智能学习已经让他们逐渐完美化。
     

    最好的方式是自然并有组织(计画)的使用关键字。若您的网页关键字是「艾菲尔铁塔」,想当然的,内文就是关于艾菲尔铁塔,包含艾菲尔铁塔的历史,推荐的巴黎酒店。换句话说,假如您只是把「艾菲尔铁塔」放在文不对题的内文中,例如狗狗的养育,那您再怎幺把努力想靠着「艾菲尔铁塔」拉高网页排名也是很有限的。我们的目的不是把文章内的所有关键字都提高排名,而是必须集中在某些用户会使用的关键字。

    关键字密度的迷失

    根据Edel Garcia博士在The Keyword Density of Non-Sense所述,关键字密度并不是现代排名演算法的一部分。
     

    若有两个网页,D1与D2,D1包含1000文字(l=1000),其中关键字20次(tf=20),关键字密度软体分析出文件的关键字密度(KD)为20/1000 = 0.020 (or 2%)。同样的,D2包含500文字(l=500),其中关键字10次(tf=10),也会出现同样的密度结果。所以很显然的,关键字密度分析没办法解释哪个网页更具关联性,也无法跟我们说这些:

    1. 关键字之间的相对距离。(接近度)
    2. 语词的分布位置(分布度)
    3. 语词之间的共被引(这是专有名词: 意思是同时被引用)频率(同时被提及)
    4. 关键字与题材,主题,和副主题(主题内文一致)

     

    总结来说,关键字密度与内容,质量,语意和关联性都没有关係。

    网页优化

    关键字的使用方式与目标锁定仍然是搜寻引擎排名演算的一部分。我们可以利用一些有效的关键字使用技术来帮助网页优化。在Moz,我们做了很多测试并获得许多关于搜寻结果与关键字使用策略的手段。在网站优化中,我们建议您这样使用关键字:
     

    请不要在同个网站使用关键字做网页内部连结,也就是所谓的关键字竞食。
     

    注:「关键字竞食」网站上的多个网页上有着定位一样的关键字,会导致搜索引擎难以判断哪个网页才是最相关的搜索查询重点,因而 SERP(搜寻引擎结果页面) 不一定会以户想看到的网页与内容搜寻首位。
     

    一个网页的关键字优化是怎样的呢?这里以「运动鞋」做例子:
     

    至少在title 标籤使用一次关键字。尽量让关键字越在title 标籤的前面越好。关于title标籤在本章节的后面会讨论。
    关键字放在最明显的网页最上方。
    在网页内文至少放上二或三次的关键字,包含文字变化型。若文章内容很长,可再放多一些。频繁的使用关键字您也许认为会有额外的收穫,但其实根据我们的经验,对网页排名基本没有益处。
    在网页的图片上的alt属性至少使用一次关键字。这不仅仅是帮助网页搜寻,也帮助图片搜寻,偶尔也会带来流量。
    在URL使用一次关键字。关于URL与关键字的使用规则在本章节的后面会讨论。
    在meta description标籤至少使用一次关键字。请注意meta description标籤并不会帮助搜寻引擎的排名,但因为搜寻引擎会抓取其内容并揭露在搜寻结果页面,所以它可以吸引点击率。​

     

     

     

    来源:MOZ


    学海无涯 , 版权所有丨如未注明 , 均为原创丨转载请注明第四章:SEO搜寻引擎最佳化的基础开发与设计 (上)
    喜欢 (0)
    发表我的评论
    取消评论
    表情 加粗 删除线 居中 斜体 签到

    Hi,您需要填写昵称和邮箱!

    • 昵称 (必填)
    • 邮箱 (必填)
    • 网址