第21次中国互联网络发展状况统计报告

网站可用性, 网站策划, 网络收藏 No Comments »

 中国互联网络发展状况统计报告PDF电子书

我国网民达到2.1亿  互联网向各层次扩散

2008年1月17日,中国互联网络信息中心(CNNIC)在京发布《第21次中国互联网络发展状况统计报告》。数据显示,截止2007年12月31日,我国网民总人数达到2.1亿人,目前中国网民仅以500万人之差次于美国,居世界第二,CNNIC预计在2008年初中国将成为全球网民规模最大的国家。尽管网民数的增长使得互联网普及率提高至16%,但仍低于19.1%的全球平均水平。

我国域名总数达到1193万个,年增长率高达190.4%,增长的主要拉动来自国家顶级域名.CN,CN域名数量已达到900万个,比2006年同期增长了4倍;CN域名下网站数量首次突破百万达到100.6万个,在150万的网站总量中“三分天下有其二”。

互联网呈现向下兼容的趋势

CNNIC报告首次对新增网民构成进行了细化分析。2007年新增网民中,向各层次扩散的趋势明显:18岁以下的网民和30岁以上年龄较大的网民增长较快;初中及以下受教育程度的网民增长较快;低收入人群开始越来越多地接触互联网。

另外,CNNIC数据显示,快速增长的农村网民成为新增网民的重要组成,7300万新增网民中的4成,即有2917万来自农村;截至2007年12月底,我国农村网民数量达到5262万,年增长率达到127.7%。这一数据表明:农村网民的高速增长,使得农村成为一个拥有巨大潜力的互联网消费市场,随着 “村村通电话”、“乡乡能上网”、“乡乡有网站”等乡镇信息化普及工程的推进,农村互联网市场必将大有可为。网络基础资源发展势头仍然强劲

随着网民数量的增长,互联网基础资源的发展势头也“当仁不让”。作为基础地址资源 “根本”的IP地址和域名年增长率分别达到了38%和190.4%,保证了互联网的发展需求。截止2007年12月底,我国IP地址数已达到1.35亿个,但与每个网民一个IP地址的基本需求相比,缺口还很大;国家CN域名在2007年迅速崛起,涨幅高达4倍,即每天增长2万个,创下了世界域名史上增长奇迹。CN域名和CN域名下网站双双大幅度超过国内COM域名,巩固了国家域名的主流地位。另外,网站数、网页数和网页字节数均以超过60%的速度增长,网民可以享用的信息资源越来越丰富。

数字娱乐成为中国网民网络应用的重心

对于互联网多种应用模式的解读是本次报告的一大亮点。CNNIC调查显示,中国网民首选的互联网应用发生了转移,娱乐已经成为我国互联网最重要的网络应用,前七类网络应用的使用率排序依次是:网络音乐(86.6%)>即时通信(81.4%)>网络影视(76.9%)>网络新闻(73.6%)>搜索引擎(72.4%)>网络游戏(59.3%)>电子邮件(56.5%),体现互联网娱乐作用的网络音乐、网络影视等排名明显靠前,94.2%的网民对互联网的娱乐功能给出了正面评价。数据显示,使用网络音乐的网民高达1.81亿,使用即时通信的网民高达1.7亿,近40%的网民选择即时通信为上网第一落脚点,而网络新闻、电子邮件等互联网基础应用落在其后,其中“电子邮件”在2007年之前一直位居中国互联网用户的应用率最高的榜首。互联网娱乐功能成为网民快速增长的拉动因素之一。

CNNIC挖掘三大优势,加大研究深度

目前互联网产业规模急剧膨胀,成为世界互联网的主流市场,各种细分领域服务与应用如雨后春笋,发展路径纵横交错,网民差异性越来越大。要认知互联网发展现状,需要对中国互联网进行更广泛、更深层次的研究、分析,CNNIC将由以往偏重数字记录的“统计报告体系”向领域更广、更有深度的“研究报告体系”转变。CNNIC将在十年积累的调查数据和科学经验的优势之上,挖掘以下两方面优势的潜力,第一是作为我国互联网基础设施和行业服务机构的优势,第二是多年来与国际互联网界的合作研究和交流的优势。新的研究报告体系将延续十年互联网统计报告客观、公正的风格,以更权威的数据,更科学的研究方法,更深入的研究分析,更前瞻的策略建议,为政府、企业和网民提供参考。

胡宝介:搜索引擎优化技术教程连载更新中

SEO优化, 网站策划, 网络收藏, 网络营销 No Comments »

第一部分:域名和主机对 SEO 的影响

     域名与主机是网站的基础,商业网站选择域名与主机尤其应注重形象和质量,为网络营销开展打好坚实基础。同时,选择好域名与主机也是搜索引擎优化开始的第一步。
                域名选择与 SEO

域名与 IP:
     每一个网站的域名对应一个 IP 地址,IP 地址是在网络上分配给每台计算机或网络设备的数字标识。域名必须经过域名服务器(DNS)进行解析,转换成数字 IP,才能让计算机理解辨认,如:219.136.248.149
     大部分中小企业网站都存放在由一台服务器划分出来的若干虚拟主机上,由多个网站共享一台服务器和 IP 地址,一些 WEB 服务器中有成百上千个域名共享一个 IP 地址的情况。这样对站长来说成本较低,但对网站的搜索引擎排名带来以下潜在风险:

1、共享主机的其他网站如果被搜索引擎惩罚,将或多或少波及你的网站。对此,AltaVista有如下忠告:“如果同一 IP 下有一个网站作弊,那么我们的搜索引擎会对该 IP 下的所有网站进行惩罚”;不过幸运的是,大部分搜索引擎不会如此武断,如 Google,一般是不会进行这种连带性惩罚的。
2、如果搜索引擎对有些 Spammer 服务器进行了惩罚,其 IP 被认为是 Spam,则连带该 IP 下的所有网站都会受到牵连,使这些网站的排名下降或在搜索引擎中被清除。
工具推荐:
查域名 IP:http://www.123cha.com/ip
IP 反查:http://www.whois.sc/members/reverse-ip.html (查看某 IP 地址下共享哪些域
名。免费注册)
二级域名(次域名):
     二级域名形式如:yourname.site.com,而不是 www.yourname.com。拥有自己的独立域名是网站对搜索引擎友好的基础。目前有很多网站提供免费空间,如博客(Blog)免费空间, 企业免费空间, 免费自助建站,电子商务平台等,通常为用户分配一个二级域名,或页面存放于网站的某一路径下。这都极不利于搜索引擎重视你的网站,二级域名除了用户访问不方便以外,还主要有以下弊端:
1.如果你所使用二级域名的主域名受到惩罚,那么你的网站也会受到牵连;
2.很多搜索引擎会规定每个域名下的收录数(如:www.seochat.org、english.seochat.org与 bbs.seochat.org),如果 www.seochat.org 这一域名的收录数上限是 30,而你的网站是第 31 个,则你的网站被搜索引擎收录的机会就会少至又少了;
3.当域名供应商停止营业,那么你辛苦经营的网站也随着你域名的失去而付诸东流;

4.网站流量排名的时候,你所有的流量都会归功于所依托的顶级域名。
     最好为自己的二级域名网站注册一个独立域名,然后做域名转发(免费),目前很多拍卖网的店铺都适合采用此种方法,对顾客访问和网站管理很有用。
域名中的字符:
     取域名的原则除了方便用户访问之外,对搜索引擎而言,涉及到域名中是否包含关键词的问题。英文网页内容的网站如果在域名中含有关键字,或以复合关键字作域名,都应该用短横线隔开。如:www.made-in-china.com 而不是 www.madeinchina.com。这是因为搜索引擎通常会把分隔符“-”当作一个空格来看待,因而能够识别出你的关键词,为网站排名加分(尽管影响不是很大)。短横线隔开后的关键词组还可以获得更多的词组搜索结果,如w.madeinchina.com 被认为只有一个词 madeinchina,而 made-in-china 则被看作正常的made in China 词组。
     有些搜索引擎目录对网站在分类目录中的排名顺序是根据域名或网站 title 名称的数字顺序或字母顺序甚至中文笔画,总体上数字又比字母靠前。Yahoo!中国称,“在同一类目中,网站是按照拼音顺序来排列的”。Google 则根据其独创的“网页级别”技术“分辨出常用的重要网站,排放在目录的前面以提升网页搜索的效率”(Google 语)。
     此外,域名的后缀选择也有一定讲究。有一种观点认为:在同等情况下,代表非商业性网站的后缀.org 和.net 有着比.com 更高的排名优势;对中文网站来说,表示中国域的.cn 和.com.cn 又比无地区性的.com 有一定优势。
附 : ICANN 授 权 的 中 国 顶 级 域 名 注 册 商 及 其 授 权 域 名 注 册 范 围
http://www.wm23.com/resource/R02/domain_2004.htm
工具推荐:
www.whois.sc 查询在核心字符下尚可注册的域名

                主机选择与 SEO

主机服务商选择:
     主机对网站的搜索引擎排名影响很大。在寻找主机提供商的时候,千万不要只考虑价格因素。如果你多次向 Google 提交网站,但 Google 却一直没有对其进行索引,则有可能是网站所在的服务器出了问题。因此选择服务器时要特别注意以下几点:

1、避免使用免费主机:由于免费主机里面经常会出现 Spammers、镜像网站、桥页等“搜索引擎垃圾”,很多搜索引擎都不愿意索引免费主机上的网站;同时搜索引擎目录如 Yahoo 也很难收录来自免费主机的商业站点。此外,免费主机的服务很难保证,常常服务器超载,速度奇慢,宕机频繁,甚至关闭服务,这都会直接影响网站排名。
2、选择有信誉的主机提供商:搜索引擎的索引程序定期或不定期地来访问收录的网站。对经常更新的网站,Google 的 Googlebot 漫游器——俗称“蜘蛛”,一般每天都会小幅度地“爬”一下,一个月进行一次大的索引。如果蜘蛛在索引时出现网页打不开或下载速度缓慢,则放弃索引。所以你的网站在任何时候都要正常工作,以博取蜘蛛的欢心。这就要求网站存放的主机系统提供快速、稳定、安全的服务,最好有 24 小时客服支持和维护,保证你的网站快速、可靠、稳定地运行。
主机转移:
     如果你想转移网站的主机服务,要在取消原来的服务提供商之前,先找好新的供应商。先在新的服务商处开个帐号,确保所有的文件都正确无误地传到新服务器上。网站在新服务器上运行无碍后再联系你的原供应商,告知对方将终止合作,但确保他们不会马上关你的网站。再联系你的域名注册商(可能是原主机提供商),变更域名服务器(DNS)。域名服务器的功能就是把你的域名解析成计算机能够识别的 IP 地址。把旧的域名服务器改成新的,这个过程到生效时间大概 24-48 小时之内,少数情况下可能要 72 小时。这期间,如果一个搜索引擎刚好来抓你的网页,要么抓到旧的 IP 地址上的网站,要么抓到新的域名解析生效后的网站,总之都不会出现网站打不开的空档。

第二部分:搜索引擎优化的核心:关键字策略

     根据潜在客户或目标用户在搜索引擎中找到你的网站时输入的语句,产生了关键字
(Keywords)的概念,这不仅是搜索引擎优化的核心,也是整个搜索引擎营销都必须围绕的核心。

关键字的选择

     首先确定你的核心关键字,再围绕核心关键字进行排列组合产生关键词组或短句。对企业、商家而言,核心关键字就是他们的经营范围,如产品/服务名称、行业定位,以及企业名称或品牌名称等。总结起来,选择关键字有以下技巧:
1、站在客户的角度考虑
     潜在客户在搜索你的产品时将使用什么关键词?这可以从众多资源中获得反馈,包括从你的客户、供应商、品牌经理和销售人员那里获知其想法。
2、将关键词扩展成一系列词组/短语
     毋用单一词汇,而是在单一词汇基础上进行扩展,如:营销→网络营销→网络营销管理。英文关键词可以采用搜索引擎 overture 的著名工具 Keyword Suggestion Tool 对这些关键词组进行检测,可查看你的关键词在过去 24 小时内被搜索的频率,最好的关键词是那些没有被广泛滥用而又很多人搜索的词。中文工具可以通过百度的“相关搜索”和 Google 提供的KeywordSandbox 工具进行关键词匹配和扩展。
工具推荐:
Google AdWords 关键字工具:查询特定关键词的常见查询及扩展匹配
https://adwords.google.com/select/KeywordSandbox
百度关键字工具:查询特定关键词的常见查询、扩展匹配及查询热度
http://www2.baidu.com/inquire/dsquery.php
3、进行多重排列组合
     改变短语中的词序以创建不同的词语组合。使用不常用的组合。组合成一个问句。包含同义词、替换词、比喻词和常见错拼词。包含所卖产品的商标名和品名。使用其它限定词来创建更多的两字组合,三字、四字组合。
4、 毋用意义太泛的关键字。
     如果你从事包装机械制造,则选择“机械”作为你的核心关键字就无益于吸引到目标客户。实际上,为了准确找到需要的信息,搜索用户倾向使用具体词汇及组合寻找信息(尤其是二词组合),而不是使用那些大而泛的概念。此外,使用意义太广的关键字,也意味着你的网站要跟更多的网站竞争排名,难以胜出。
5、用自己的品牌做关键词
     如果是知名企业,则别忘了在关键词中使用你的公司名或产品品牌名称。
6、使用地理位置
     地理位置对于服务于地方性的企业尤其重要。如果你的业务范围以本地为主,则在关键词组合中加上地区名称如“深圳网站建设”。
7、回顾竞争者使用的关键词
     查寻竞争者的关键词可让你想到一些你可能漏掉的词组。但不要照抄任何人的关键词,因为你并不清楚他们如何要使用这些关键词——你得自己想关键词。寻找别人的关键词只是对你已经选好的关键词进行补充。
8、不用与自己无关的关键字
     总是会有人将热门的词汇列入自己的 META 关键字中——尽管这个热门关键字跟自己网站内容毫不相干。甚至有人把竞争对手的品牌也加入到自己的关键字中,这不仅侵权,可能被起诉(国外多起类似案例),并且由于这些所谓“热门”词汇并未在网站内容中出现,因此对排名并无实质帮助,过多的虚假关键词还可能受到处罚降低排名。
9、控制关键词数量
     一页中的关键词最多不要超过 3 个为佳,然后所有内容都针对这几个核心关键词展开,才能保证关键词密度合理。搜索引擎也会认为该页主题明确。如果确实有大量关键词需要呈现,可以分散写在其它页面并针对性优化,让这些页面也具有“门页(entry)”的效果。这也是为什么首页和内页的关键词往往要有所区分的原因。最典型的情况是拥有不同的产品和服务的情况下,对每个产品进行单网页优化,而不是罗列在一个首页上。
     附:查看竞争对手关键词的方法:在浏览器中打开目标网页→点击“查看”→点击“源文件”
→“

关键字密度

     在确定了自己的关键字之后,需要在网页文本中适当出现这些关键字。关键字在网页中出现的频次,即关键字密度 (Keyword Density) ,就是在一个页面中,占所有该页面 中总的文字的比例,该指标对搜索引擎的优化起到重要作用。关键字密度一般在 1% 到
7% 较为合适,超过这一标准就有过高或过低之嫌。
     切记避免进行关键字堆砌,即一页中关键字的出现不是根据内容的需要而安排,而是为了讨好搜索引擎人为堆积关键字(Stuffing)。这已经被搜索引擎归入恶意行为
(Spamming), 有遭到惩罚的危险。
工具推荐:

关键字密度检查(英文):频繁出现的关键词及其密度

www.seotoolkit.co.uk/keyword_density_analyser.asp(适用于英文关键词)

关键字分布

关键字的分布原则堪称:无所不在,有所侧重。
1、网页代码中的 Title,META 标签(关键字 keywords 和描述 description)
     如:e 书时空 www.eshunet.com 的代码:

2、网页正文最吸引注意力的地方
     正文内容必须适当出现关键词,并且“有所侧重”,意指用户阅读习惯形成的阅读优先位置 ——从上到下,从左至右——成为关键词重点分布位置,包括:页面靠顶部、左侧、标题、正文前 200 字以内。在这些地方出现关键词对排名更有帮助。如 SEO 学习网站
www.seochat.org 的站长独辟蹊径,把一段富含关键词的文本网站介绍置于网站最顶部(这个地方通常被安排用来放 banner 广告的)。这样做的好处是让用户和蜘蛛都以最快速度了解该网站内容,并且以蜘蛛重视的黑体显示,对其排名作用很大。代码显示如下:
     本站是一个非商业性的网站,旨在为广大的搜索引擎研究者提供一个学习、交流场所。在这里你可以找到很多有关于搜索引擎优化资料(seo 资料,文章)、网站优化资料。这些资料可以帮助你将你的网站进行适当的优化以迎合多个搜索引擎的搜索规则,从而得到较好的排名。
3、超链接文本(锚文本)
     除了在导航、网站地图、锚文本中有意识使用关键字,还可以人为增加超链接文本。如一个童装厂商网站可以通过加上以下行业资源:
中国童装网 织里童装网……
     等含有“童装”文字的链接来达到增加超链接文本的目的。这也值得网站在添加友情链接时做参考,即链接对象中最好包含有你的关键字或相关语义的网站。
4、Header 标签
     即正文标题

中的文字。搜索引擎比较重视标题行中的文字。用加粗的文字往往也是关键词出现的地方。
 

增加博客链接出现的15种方式

博客推广, 网络收藏, 网络营销 No Comments »

公开写博客,自然希望更多的人看到。如何让更多的人通过链接访问到你的博客呢?以下总结的15种方式,您是否都应用过了呢?

1、最自我的方式,出现在自己的文章里。经常在文章中提到自己的博客并带有超链接是很好的方式,不但可以让读者加深印象,还是SEO 最基本常见的方式。同时还可以让懒惰的剽窃文章的人给你做做广告。

2、最优质的方式,出现在别人的文章里。写了好文章自然会有人推荐或在文章中提到,口碑的力量是无穷的。为此不但要提高文章品质,还应该经常参与他人的话题,彼此交流沟通。

3、最普遍的方式,出现在别人博客的友情、推荐、交换链接列表里。分别对应着你的朋友数量多少、影响力大小、PR值的高低。

4、最长尾的方式,出现个人注册资料里。无论注册网站还是网络应用,不要只留个用户名,添写包括博客地址、邮箱、IM号码等信息是很好的宣传方式。而且日益增多的WEB2.0应用和SNS 站点,更体现了这种方式的长尾特性。

5、最互利的方式,出现在widget插件或博客链里。彼此显示对方的地址,互利互惠,但此种方式已经开始被google 视为一种作弊的方式。未来发展不容乐观。

6、最web2.0的方式,出现在网络书签和Digg站点里。优秀的博客和文章会被人收藏和推荐,这也是最客观、最能体现价值的方式。

7、最荣耀的方式,出现在各种排行榜单里。如果你的博客优秀到可以经常出现在各种评比、统计、奖项的排行中,那将是增加流量和订阅量最有效的方式了。

8、最主动的方式,出现在别人的网站或博客评论里。尽量不采用匿名的方式留言,即尊重了对方,又可以增加链接。留言需要填写包括用户名、邮件地址、网站/博客地址。不要总喜欢把博客地址写在留言里,这样做只会被插件屏蔽或引起对方的反感。

9、最被动的方式,出现在博客目录站点里。将自己的博客地址提交到众多的目录站点中,尤其是那些PR和Alexa排名高的站点。记得要给博客准确的分类,方便他人检索。例如:”blogcatalog“更多目录列表参见这里

10、最直接的方式,出现在与他人的对话里。博客作为最具个性化的媒体,逐渐成为被人认同和了解的方式,尤其是通过网络交流的时候。访问彼此的博客地址甚至比现实中的交换名片起到的作用更大。

11、最隐蔽的方式,出现在邮件或论坛的个性签名里。由于附属于主要的内容之外,因此很可能被人忽视。但邮件和论坛是被我们最频繁使用的网络功能,而且签名只需要设置一次,即可一劳永逸。

12、最热闹的方式,出现在各种聚合方式里。包括各种圈子、群组、Feed 聚合,同类别的内容聚合不但扩大影响力还可以通过交流将话题探讨的更深入。但有时圈子里的虚假繁荣会使自己的眼界不够开阔。

13、最精确的方式,出现在博客地图里。将地图与博客地址mashup 混搭在一起,就可以通过地理位置精确的查找到就在你身边的bloggers。国内有”blogmap“,参见博客士的推荐Blogsir 在这里。国外有”feedmap“,通过google api 也可以自己做个blog map。

14、最技巧的方式,出现在相关文章链接里。利用Blog 程序的相应插件,统计显示最近或访问最多文章。或通过tag 或关键词来显示相关联文章,也可以应用在Feed 阅读工具中。达到提高旧文章的显示次数的目的。

15、最有效的方式,出现在搜索结果里。如今搜索引擎越发被人们依赖,内容能被引擎的蜘蛛及时捕获也成为最有效的方式。通常因为你的博客里某个热门关键词在搜索结果中靠前,就会带来无限的流量。尤其如今有了更多的专业博客搜索引擎,可以对你的博客全内容搜索。除了手工提交博客地址到google 、yahoo、百度等引擎,还可以利用博客报介绍过的”Pingoat“、”feedsubmitter“之类的提交工具来提高效率。至于如何使自己的博客排名靠前,则属于另一个需要探讨话题了。

您还有其它的方式吗?如果有,请补充!

作者:blogsir 文章出处:博客报–All about blogging.

增加反向链接的101个方法[中文]

SEO优化, 网站可用性, 网络收藏, 网络营销 No Comments »

增加反向链接是一件费时间,令人烦恼,有时候让人迷惑的事。但是,无可避免。最终,链接是好的排名的王牌。 很多人希望情况会改变。

问题:

1) 建立反向链接在一段时间内对排名还很重要吗?

2) 什么时候链接流行度才能被降低权重,增加其他算法因素(那些对站长不这么烦琐的)?

回答:

1) 对不起,建立反向链接在可预见的未来对SEO还是王牌。

2) 在Semantic Web 到来之前,或者也许HTTP被别的协议取代之前,链接流行度都不会在搜索引擎算法被降权。因为链接还是网上基本的联接,基本的关系。在可预见的未来,对计算机程序来说,链接还是判断网页重要性和可信度的最简单方法。

搜索算法将会有的变化已经在发生中了。Google算法已经更细腻智能,大量不该被计入的链接已经被降权,被信任的链接有更高权重。这些链接所给予的信任度要经过如用户数据,域名年龄,和其他很难被作假的因素所验证。 别骗自己。应该被计入的链接还是排名的关键,至少在Google,MSN 和Yahoo!只差一点。
71个建立链接的好方法

表列是最爱

1.搞一个XXX的101个方法。这种文件经常被引用,经常会成为权威文件。人们没法不链接向这种表列。

2.写一篇“帮你XXX的10个窍门”文章。非常容易得到链接。

3.针对某个话题总结一个完整的参考资料列表。

4.总结某话题或行业等的十大迷思。

5.列出行业专家名单。如果你能给这些所列的人好印象,或者把你的项目搞的挺有架势,这些专家可能连向你的网站,或者表示感谢。(有时候拍拍马屁是与权威搞好关系的最简单办法。)

建立权威并容易让别人链接

6.内容写的简单易懂,这样更多人能看懂并帮你传播。

7.尽量减少语法和拼写错误,尤其是你想让权威链接向你的话。

8.网站上要有容易找到的隐私权政策和关于我们页,这样站点看起来更让人信任。放上张自己的照片可能有助于建立权威度。

使用竞价排名作为建立链接工具

9.用竞价排名买流量。相关的流量会给你的网站带来访问者和品牌曝光。无论从什么渠道来,人们来到你的网站就有链接向你的可能性。

新闻和聚合

10.在EzineArticles, GoArticles, iSnare(译注:都是发表文章的网站)等处发表文章。这些文章站的好处是他们的文章页排名真的很好,并且带来高质量的流量。

11.向行业新闻网站递交文章。有关于SEO的网站?写文章递交到WebProNews。关于XXX的网站?提交到XXX信息网。

12.发送新闻稿。花点时间写的好点,有新闻性点。Email给一些选出来的记着和bloggers。Email要写的个人化。提交到PRWeb, PRLeap, 等。

13.跟踪谁发表了你的文章或新闻。给他们提供独家新闻或内容。

14.和其他站长交换文章。

15.有重要相关新闻时Email一些朋友,请他们提意见,如果觉得有用能不能引用一下。

16.有的公司网站列出关于他们的新闻,写这些公司,并连向他们。他们也会连回你谈论他们的网页。如果你的网站有新闻栏目或博客就很容易了。到Google搜一下“你的行业+新闻”。

17.做一个能让人们感觉自己很重要的调查。如果你能让别人感觉自己重要,他们会为你免费宣传。Salary.com做了一个关于低薪妈妈的研究,得到大量高质量链接。
目录,投票排名,社会化书签

18.很老但有用的窍门:把网站提交到开放目录和其他免费收录的目录。

19.提交到其他收费目录。也挺老套。记住质量很重要。

20.建立你所感兴趣领域的自己的垂直目录。显然要连向你自己的站点,可能的话连向重要内页。当然如果它真的是有用的资源,它自己就会吸引链接。

21.在Del.icio.us等网站加标签(tag)。如果人们觉得你的标签加的有用及时,他们可能顺着找到你的网站。

22.如果你写了高质量的内容,别忘了请几个朋友给你的文章加标签。如果你的网站进入Digg的首页或Del.icio.us最热门页,成百上千的bloggers会看到你的站点,也可能连向你。

23.看看什么内容传播最快。如果你写出关于热门话题的原创内容(并连向原始资源),你的网站也可能被投票排名网站列为信息源。
本地和商业链接

24.加入Better Business Bureau。(译注:鉴定监督网站资质的机构)

25.从当地商业委员会找个链接。

26.向相关城市和政府资源网站提交你的网站。(有的国家容易,有的难。)

27.在当地图书馆的网站列出你的网站。

28.问问你的生产厂家或零售商或其他商业伙伴是否能链接向你的网站。

29.与同领域但非竞争的公司发展关系。在线上和线下都充分利用这些关系,通过链接互相推荐或帮助散发名片。

30.建立联署计划(affiliate program)。这些链接没什么SEO价值,但增加的曝光会带来其他正常的链接。
免费链接

31.根据你行业和产品的不同,你可能发现Craigslist是便宜或免费的分类广告。

32.在Yahoo! Answers问或回答问题都很简单,还可以提供链接到相关信息。

33.在Google Groups 问或回答问题都很简单,还可以提供链接到相关信息。

34.如果你的公司有一定信誉,在Wikipedia建立个和你公司有关的页,或找其他行业Wiki。如果直接列上你的站点有困难,试试加上有链接到你网站的页。

35.在Squidoo建立网页只需要15分钟,能使你看起来像行业专家。连向权威文件和其他受欢迎的有用工具,也连向你自己的站点。

36.向digg提交文章,也可以提交其他内容,这些连接权威度会有一些流回你的个人介绍页.

37.如果你提供RSS feed 而且你的内容有用,经常更新,有人会聚合你的rss内容.(有些会有连接,有些没有.)

38.大部分论坛允许会员留名连接或个人介绍连接.如果你对论坛有贡献,人们会从这些连接找到你的网站,连接想你的网站或者买你的产品.

评论

39. 大部分品牌在网上都没有什么知名度,如果你的网站有一定的权威度,你的评论内容经常能排名不错.

40.在Amazon.com评论相关产品.能带来直接客户和连接.

41.在Amazon.com建立评论产品的列表,提一下你的背景(连接).

42.在alexa评论相关网站,会带来相关流量.

43.在epinious等购物引擎评论产品和服务,帮助建立你的权威.

44.如果你买了什么产品或服务,很满意,写个推荐,这些推荐经常变成连接.写推荐的两个窍门:写的可信,可能的情况下要具体.

博客和博客圈

45.写博客,不要为写而写.经常更新的好的内容容易得到连接.

46.从你的博客连想其他博客.导出连接是最便宜的营销手法.很多写博客的人跟踪谁连接到他,流量从哪来,连向他们是让他们注意到你的简单方法.

47.从其他博客留评论.这些评论没有什么直接价值,但如果你的评论有用,有深度,相关,可以带来流量.也使其他blogger注意到你,他们可能开始读你的blog,也可能连向你.

48.technorati的标签页在yahoo和msn排名都不错,在google差点.如果你的博客很新,也可以被放在technorati的标签页.

49.别忘了向博客目录提交.

网站设计作为连接元素

50.使你的站点web2.0化.人们喜欢连向你使用ajax的站.在最分化的市场也能用ajax功能.

51.验证网页HTML码(W3C等)。这间接使你的网站具有更高可信度,更能吸引链接,尤其对政府网站和设计社群。

52.买一个好看的CSS新设计。好的设计能够从CSS Vault等得到链接。
雇用帮手

53.雇用一个公关专用人士。公共关系PR(不是网页级别),虽然老套,但是还很有用。看一下Eric Ward。
54.雇用一个顾问。没错,建立反向链接的工作可以由别人来做,只是要确保你找的是专家,我们推荐WeBuildPages, Debra Masteler 和Andy Hagans。

链接交换

55.交换一些链接。我们在推荐交换链接?没错,小范围的,在相关网站之间的,而且能带来流量的。离那些链接工厂,链接联盟远点。
56.在交换链接的时候,最好从相关的内容页得到链接。避免列着几百上千个无关友情链接的页面。只和那些就算没有搜索引擎存在,你也想和他交换链接的网站交换链接。除了主题之外,在交换链接的时候,也可以想一下目标用户群的相似度。
买网站,租用链接和广告
57.从一些链接中间商那儿租用一些高质量的链接。Text Link Ads是这个专门市场最有信誉的公司。

58.从一些网站直接租用一些高质量的链接。有的时候最强有力的租来的链接,可能来自于那些平常不太出租链接的网站。

59.做赞助商。各种慈善机关,竞赛和会议都会链接向他们的赞助商,这可以带来可见度,链接,还有内心的感动。

60.在eBay上面拍卖东西,然后把所得利润捐献给慈善机关。很多慈善机构会链接向eBay上的拍卖网页和你的网站。
61.很多搜索算法都倾向于给老的网站更多权重。可能买一个已经有很多链接的老的网站更快一点,然后从这个网站链接向你自己的网站。从新开始建立一个有权威性的链接和网站要费更多时间。
利用法庭(小心使用)

62. 控告google.

63.被一个大家都恨的公司控告。当Aaron被Traffic Power控告的时候,他得到了成千上万的链接,包括来自Wired和华尔街日报。(译注:Aaron曾披露一个使用作弊SEO的公司,被那家公司告。)

免费赠送

64.举办一个竞赛。竞赛比赛是非常好的链接诱饵,几百块钱的奖品能带来价值几千块钱高质量的链接。不用多说了。

65.开发一套有用的工具。原创的有用的工具,还有把工具集合在一块,能得到很多链接。看看贷款计算器的价值。

66.给内容管理系统例如WordPress做一个开源设计模板,别忘了在模板里放上“由XXX设计”。

67.发放免费样品,换取反馈意见。

68.开发一个FireFox插件。在你的网站上要做好下载和支持页,来让人们链接向它。

会议和社会互动

69.把一些很重要的活动和事件拍下来非常简单,然后再配上解说,告诉人们为什么重要。在你的行业(喝醉了的)名人的照片,可能是很好的链接诱饵。

70.把真实世界的社会关系发展到链接关系。如果你去参加和SEO相关的大会,可以很轻易的看到Tim Mayer, Matt Cutts和Danny Sullivan。在其他行业也一样,平常根本看不到的人物,在贸易会议中很容易找到。面对面更容易发展关系。一旦和这些人建立了一定社会关系,把它扩展网上就比较容易了。

71.有意思的有用的访谈很容易成为原创内容,并且传播十分迅速。

72.200个可疑的收费目录(平均15块一个)提交你的网站。这些目录完全带不来流量,并且在卖无关的整个站的链接。

论坛垃圾

73.在你的签名文件里面放上100个网站。

74.只有在你能留下链接的时候才发帖子。

75.为了提高发帖数,写很多 “我也这么想”之类的帖子,同时配合着包含很多链接的签名文件。

76.你卖XXX产品,同时问谁是最好的XXX产品提供商。从同一个IP地址登录另一个论坛帐号回答自己的问题,吹嘘自己的网站多好。

77.在20个不同的论坛注册为新会员,在同一天问同一个问题。

78.在一个几年没动静的老帖子里发言,就为了留下你半相关的网站链接。

79.为了会员介绍页而在论坛注册,根本没打算参与。
博客垃圾

80.在博客评论时不留真名实姓,留关键词当名字。

81.在第一个博客评论里就极力推销你的网站。不给博客增加价值。只说你最近在XXX谈了同一个话题,大家都应该来看看。在一堆博客重复一遍。

82.不留独特的相关的评论,让人觉得是垃圾蜘蛛来了。

83.更甚者,就发个垃圾蜘蛛去自动留评论,每个帖子留30个链接。看能不能把他们的服务器弄宕机。

84.给每个谈论某话题的地方发ping,不说什么有意思的事,只提人们在谈论这个话题。

85.不链接向你ping的网站,从根本没提他们的页发ping信号。

垃圾链接交换

86.发出链接交换请求时提一下PageRank。

87.链接交换请求email看着像是程序自动发的(没有个人化,没有对方名字 )。

88.向Matt Cutts, Tim Mayer, Tim Converse, Google和Yahoo!发链接交换请求。

89.从网站几乎找不到的部分得到些链接,还和其他成百上千不相关的网站混在一起。

当面进行垃圾骚扰

90.参加站长大会,吹嘘你多有钱,你的联属计划会员什么也不干就发财了。

91.不问别人名字是什么,问他们的URL是什么,一知道他们的URL就问是否链接到你了,没有的话为什么。
坚持不懈

92.每在你的网站发篇文章就给其他站长发提醒。

93.每天给站长发email要求他们链接向你。

94.从不同email地址给同一个站长发信谈你的网站(聪明呵? )。

95.如果上面这些都没給你带来一个免费链接,就说愿意付一块钱。每天加一块直到他们同意。
当个混球能得到链接

96.向RIAA看齐(译注:美国录音行业协会),控告一个12岁的小孩(译注:因通过KaZaA下载音乐被控告的小女孩)。不行的话,通过各种必要的手段获得负面新闻。

97.从名人那偷内容。删掉原作者。聚合很多渠道然后就等着他们开始谈论你。

98.向排名高的网站发假的referrals,保证隆胸效果,小鸡鸡变大,上百万没人领的秘密存款。

99.把URL印在T-shirt上。一边打电话或看书一边走路或开车。撞到别人时说”我原谅你,混球。”

100.把咖啡撒别人身上,或者想想其他有创意的办法惹怒别人,骗他们链接向你的网站。

101.控告其他站长连接到你的深层页面。这不仅是不良连接的作法,简直是非常糊涂。

原文:http://www.seobook.com/archives/001792.shtml

作者: Andy Hagans        Aaron Wall

翻译:  ZAC (点石互动)

整理: SEO培训

中文文字版页面 http://spiderseo.com.cn/seo/link101.html

百度(baidu)分词算法分析

SEO优化, 网站可用性, 网络收藏, 网络营销 No Comments »

之前在广州点石茶话会上也有重点讨论过百度分词算法,那里很多SEOer都认为百度在测试分词技术中,有些关键词带公司字眼的关键词,在搜索结果内容时基本上跟关键词不乎核。下面是中科院软件所张俊林一篇百度分词算法的三步曲,希望能帮SEOer解答一些关于百算分词算法的问题:

询处理以及分词技术

随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为 普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把有代表性的搜索引擎作为研究对象。搜索引擎经济的崛起,又一次向人们证明了网络所蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数据,以及大量等待去费力挖掘的金矿。

但是,如何设计一个高效的搜索引擎?我们可以以百度所采取的技术手段来探讨如何设计一个实用的搜索引擎。搜索引擎涉及到许多技术点,比如查询处理,排序算法,页面抓取算法,CACHE机制,ANTI-SPAM等等。这些技术细节,作为商业公司的搜索引擎服务提供商比如百度,GOOGLE等是不会公之于众的。我们可以将现有的搜索引擎看作一个黑盒,通过向黑盒提交输入,判断黑盒返回的输出大致判断黑盒里面不为人知的技术细节。

查询处理与分词是一个中文搜索引擎必不可少的工作,而百度作为一个典型的中文搜索引擎一直强调其“中文处理”方面具有其它搜索引擎所不具有的关键技术和优势。那么我们就来看看百度到底采用了哪些所谓的核心技术。

我们分两个部分来讲述:查询处理/中文分词。

一、查询处理

用户向搜索引擎提交查询,搜索引擎一般在接受到用户查询后要做一些处理,然后在索引数据库里面提取相关的信息。那么百度在接受到用户查询后做了些什么工作呢?

1、假设用户提交了不只一个查询串,比如“信息检索 理论 工具”。那么搜索引擎首先做的是根据分隔符比如空格,标点符号,将查询串分割成若干子查询串,比如上面的查询就会被解析为:<信息检索,理论,工具>三个子字符串;这个道理简单,我们接着往下看。

2、假设提交的查询有重复的内容,搜索引擎怎么处理呢?比如查询“理论 工具理论”,百度是将重复的字符串当作只出现过一次,也就是处理成等价的“理论工具”,而GOOGLE显然是没有进行归并,而是将重复查询子串的权重增大进行处理。那么是如何得出这个结论的呢?我们可以将“理论工具”提交给百度,返回341,000篇文档,大致看看第一页的返回内容。

OK。继续,我们提交查询“理论 工具理论”,在看看返回结果,仍然是那么多返回文档,当然这个不能说明太多问题,那看看第一页返回结果的排序,看出来了吗?顺序完全没有变化,而GOOGLE 则排序有些变动,这说明百度是将重复的查询归并成一个处理的,而且字符串之间的先后出现顺序基本不予考虑(GOOGLE是考虑了这个顺序关系的)。

3、假设提交的中文查询包含英文单词,搜索引擎是怎么处理的?比如查询”电影BT下载”,百度的方法是将中文字符串中的英文当作一个整体保留,并以此为断点将中文切分开,这样上述的查询就切为<电影,BT,下载>,不论中间的英文是否一个字典里能查到的单词也好,还是随机的字符也好,都会当作一个整体来对待。至于为什么,你用查询“电影dfdfdf下载”看看结果就知道了。当然如果查询中包含数字,也是如此办理。

到目前为止,一切很简单,也很清楚,百度怎么处理用户查询的呢?归纳如下:首先根据分割符号将查询分开,然后看看是否有重复的字符串,如果有,就抛弃多余的,只保留一个,接着判断是否有英文或者数字,如果有的话,把英文或者数字当作一个整体保留并把前后的中文切开。

接着该干什么呢?该考虑分词的问题了。

二、中文分词

首先,讲讲百度的分词时机或者条件问题,是否是个中文字符串百度就拿来切一下呢?非也,要想被百度的分词程序荣幸的切割一下也是要讲条件的,哪能是个字符串就切割啊?你当百度是卖锯条的么?

那么什么样的字符串才满足被切割的条件呢?简单说来,如果字符串只包含小于等于3个中文字符的话,那就保留不动,当字符串长度大于4个中文字符的时候,百度的分词程序才出马大干快上,把这个字符串肢解掉。

怎么证明呢?我们向百度提交“电影下载”,看看返回结果中标为红字的地方,不难看出来,查询已经被切割成<电影,下载>两个单词了,说明分词程序已经开工了,如果是比4个中文字符更长的字符串,那分词程序就更不客气了,一定大卸八块而后快。我们来看看三个字符的情况,提交查询“当然择”,看起来这个查询不伦不类,那是因为我希望看到这个字符串被切分为<当然,择>,返回结果365篇相关页面,翻到最后一页,发现标红的关键字都是” 当然择”连续出现的情况,好像没有切分,但是还不确定,那么再提交人工分好的查询“当然择”看看,返回结果1,090,000篇,基本上可以确定没有进行分词了,当然另外一种解释是:对于三个字符先切分,然后将切分后的结果当作一个短语查询,这样看到的效果和没有切分是相似的。

但是我倾向于判断百度对于少于3个字符的串没有切分,奥卡姆不是说了么“如无必要,勿增实体”,干吗做无用功呢。那么如果没有切分,会有一个随之而来的问题,怎么从索引库里面提取未切分的字符串呢?这牵扯到索引的问题,我觉得百度应该采取了两套索引机制,一种是按照单词索引,一种是按照N-GRAM索引,至于索引的具体问题,以后在详细论述。

下面我们看看百度是采取的何种分词算法,现在分词算法已经算是比较成熟了,有简单的有复杂的,比如正向最大匹配,反向最大匹配,双向最大匹配,语言模型方法,最短路径算法等等,有兴趣的可以用GOOGLE去搜索一下以增加理解。这里就不展开说了。但是要记住一点的是:判断一个分词系统好不好,关键看两点,一个是消除歧义能力;一个是词典未登录词的识别比如人名,地名,机构名等。

那么百度用的是什么方法?我的判断是用双向最大匹配算法。至于怎么推理得出的,让我们一步步来看。当然,这里首先有个假设,百度不会采取比较复杂的算法,因为考虑到速度问题。

我们提交一个查询“毛泽东北京华烟云”,又一个不知所云的查询,尽管不知所云但是自有它的道理,我想看看百度的分词是如何消歧以及是否有词典未登录词的识别的功能,如果是正向最大匹配算法的话,
那么输出应该是:”毛泽东/北京/华/烟云”,
如果是反向最大匹配算法的话,那么输出应该是:”毛/泽/东北/京华烟云”,
我们看看百度的分词结果:”毛泽东/北/京华烟云”,一个很奇怪的输出,跟我们的期望相差较多,
但是从中我们可以获得如下信息:百度分词可以识别人名,也可以识别”京华烟云”,这说明有词典未登录词的识别的功能,我们可以假设分词过程分为两个阶段:第一阶段,先查找一个特殊词典,这个词典包含一些人名,部分地名以及一些普通词典没有的新词,这样首先将”毛泽东”解析出来,剩下了字符串”北京华烟云”,而”北/京华烟云”,可以看作是反向最大匹配的分词结果。这样基本说得通。为了证明这一点,我们提交查询”发毛泽东北”,我们期望两种分词结果,一个是正向最大匹配<发毛,泽,东北>,一个是上述假设的结果<发,毛泽东,北>,事实上百度输出是第二种情况,这样基本能确定百度分词采取了至少两个词典,一个是普通词典,一个是专用词典(人名等)。而且是专用词典先切分,然后将剩余的片断交由普通词典来切分。

继续测验,提交查询“古巴比伦理”,如果是正向最大匹配,那么结果应该是<古巴比伦,理>,如果是反向最大匹配,那么结果应该是 <古巴,比,伦理>,事实上百度的分词结果是<古巴比伦,理>,从这个例子看,好像用了正向最大匹配算法;
此外还有一些例子表明好像是使用正向最大匹配的;但是且慢,我们看这个查询“北京华烟云”,正向最大匹配期望的结果是<北京,华,烟云>,而反向最大匹配期望的结果是 <北,京华烟云>,事实上百度输出的是后者,这说明可能采用的反向最大匹配;
从这点我们可以猜测百度采用的是双向最大匹配分词算法,如果正向和反向匹配分词结果一致当然好办,直接输出即可;但是如果两者不一致,正向匹配一种结果,反向匹配一种结果,此时该如何是好呢?
从上面两个例子看,在这种情况下,百度采取最短路径方法,也就是切分的片断越少越好,比如<古巴,比,伦理>和<古巴比伦,理>相比选择后者,<北京,华,烟云>和<北,京华烟云>相比选择后者。还有类似的一些例子,这样基本可以解释这些输出结果。

但是仍然遗留的问题是:如果正向反向分词不一致,而且最短路径也相同,那怎么办?输出正向的还是反向的结果?
我们再来看一个例子。提交查询“遥远古古巴比伦”,这个查询被百度切分为<遥远,古古,巴比伦>,说明词典里面有”巴比伦”,但是是否有”古巴比伦”这个词汇不确定,此时看不出是正向切分还是反向切分得出的结果,换查询为“遥远古巴比伦”,此时被切分为“遥远/古巴比伦”,这说明词典里面有”古巴比伦”这个词汇,这说明了“遥远古古巴比伦”是正向最大匹配的结果。那为什么“遥远古古巴比伦”不会被反向切分为”遥/远古/古巴比伦”呢,百度的可能选择是这种情况下选择单字少的那组切分结果。

当然还可以继续追问:如果切分后单字也一样多,那怎么办?最后看一个例子,查询“王强大小:”,百度将其切分为“王/强大/小”,是正向切分的结果,如果是反向的会被切分为“王/强/大小”,这说明有歧义而且单字也相同则选择正向切分结果。

OK,看到这里可能头已经有些晕了,最后总结一下百度的分词算法,当然里面还是有猜测的成分,算法如下:

首先查询专用词典(人名,部分地名等),将专有名称切出,剩下的部分采取双向分词策略,如果两者切分结果相同,说明没有歧义,直接输出分词结果。如果不一 致,则输出最短路径的那个结果,如果长度相同,则选择单字词少的那一组切分结果。如果单字也相同,则选择正向分词结果。

百度一直宣传自己在中文处理方面的优势,从上面看,分词算法并无特殊之处,消歧效果并不理想,即使百度采取比上述分词算法复杂些的算法也难以说成是优势,如果说百度有优势的话,唯一的优势就是那个很大的专用词典,这个专用词典登录了人名(比如大长今),称谓(比如老太太),部分地名(比如阿联酋等),估计百度采用学术界公布的比较新的命名实体识别算法从语料库里面不断识别出词典未登录词,逐渐扩充这个专门词典。如果这就是优势的话,那么这个优势能够保持多久就是个很明显的问题。

Spelling Checker拼写检查错误提示(以及拼音提示功能)
  
拼写检查错误提示是搜索引擎都具备的一个功能,也就是说用户提交查询 给搜索引擎,搜索引擎检查看是否用户输入的拼写有错误,对于中文用户来说一般造成的错误是输入法造成的错误.那么我们就来分析看看百度是 怎么实现这一功能的.

  我们分析拼写检查系统关注以下几个问题:

  (1)系统如何判断用户的输入是有可能发生错误的查询呢?
  (2)如果判断是可能错误的查询输入,如何提示正确的词汇呢?
  
  那么百度是如何做的呢?百度判断用户输入是否错误的标准,我觉得应该是查字典,如果发现字典里面不包含这个词汇,那么很有可能是个错误的输入,此时启动错误提示功能,这个很好判断,因为如果是一个正常词汇的话,百度一般不会有错误提示,而你故意输入一个词典不可能包含的所谓词汇,此时百度一般会提示你正确的检索词汇.

   那么百度是怎么提示正确词汇的呢?很明显是通过拼音的方式,比如我输入查询” 制才”,百度提供的提示词汇为: “:制裁 质材纸材”,都是同 音字.所以百度必然维持着一个同音词词典,里面保留着同音词信息,比如可能包含着下面这条词条: “ zhi cai à制裁,质材,纸材”,另外还有一 个标注拼音程序,现在能够看到的基本流程是: 用户输入” 制才”,查词典,发现没有这个词汇,OK,启动标注拼音程序,将” 制才”标注为拼音”zhi cai”,然后查找同音词词典,发现同音词” 制裁,质材,纸材”,那么提示用户可能的正确拼写.

  整体流程看起来很简单,但是还有一些遗留的小问题,比如是否将词表里面所有同音词都作为用户的提示信息呢?比如某个拼音有10个同音词,是否都输出呢?百度并没有将所有同音词都输出而是选择一定筛选标准,
选择其中几个输出.怎么证明这一点?我们看看拼音”liu li”的同音词,紫光输入法提示同音词汇有” 流丽 流离 琉璃流利”4个,我们看看百度返回几个,输入”流厉”作为查询,这里是故意输入一个词典不包含的词汇,这样百度的拼写检查才开始工作,
百度提示: ” 琉璃刘丽 刘莉 “,这说明什么?说明不是所有同音词都输出,而是选择输出,那么选择的标准是什么?
我能够猜测到的方法是对于用户查询LOG进行统计,提取用户查询次数多的那些同音词输出,如果是这样的话,上面的例子说明用户搜索”琉璃”次数比其它的都要高些,次之是” 刘丽”,再次是” 刘莉”,看来大家都喜欢查询自己或者认识的人的名字.

  另外一个小问题:同音词词典包含2字词,3字词,那么是否包含4字词以及更长的词条?是否包含一字词? 这里一字词好回答,不用测试也能知道肯定不包含,因为你输入一个字,谁知道是否是错误的呢?
反正只要是汉字就能在词表里面找到,所以没有判断依据.二字词是包含的,上面有例子,三字词也包含,比如查询 “中城药”百度错误提示:”中成药”,修改查询为”重城药”,还是提示”中成药” ,再次修改查询 “重城要”,百度依然提示”中成药”. 那么4字词汇呢?

  百度还是会给你提示的,下面是个例子:
  输入:静华烟云 提示 京华烟云
  输入:静话烟云 提示 京华烟云
  输入:静话阎晕 提示 京华烟云

  那么更长的词汇是否提 示呢?也提示,比如我输入: “落花世界有风军”,这个查询是什么意思,估计读过古诗的都知道,看看百度的提示”落花时节又逢君”,这说明什么?说明同音词词典包含不同长度的同音词信息,另外也说明了百度的核心中文处理技术,也就是那个词典,还真挺大的.

  但是,如果用户输入的 查询由两个或者两个以上子字符串构成,那么百度的错误提示功能就罢工了,比如输入查询”哀体”,百度提示”艾提 挨踢”,但是.输入为 “我 哀体 “,则没有任何错误提示.

  还有一个比较重要的问题:如果汉字是多音字那么怎么处理?百度呢比较偷懒,它根本就没有对多音字做处理.我们来看看百度的一个标注拼音的错误,在看这个错误前先看看对于多音字百度是怎么提示错误的,我们输入查询”俱长”,百度提示”剧场 局长”, “俱长”的拼音有两个:”ju zhang /ju chang” ,可见如果是多音字则几种情况都提示..现在我们来看看错误的情况, 我们输入查询”剧常”,百度 提示”:剧场局长”,提示为”剧场”当然好解释,因为是同音字,但是为什么 “局长”也会被提示呢?这说明百度的同音字词典有错误,说明在”ju chang”这个词条里面包含”局长”这个错误的同音词.让我们顺藤摸瓜,这个错误又说明什么问题呢?

说明百度的同音词典是自动生成的,而且没有人工校对.还说明在自动生成同音词典的过程中,百度不是根据对一篇文章标注拼音然后在抽取词汇和对应的拼音信息获得的,而是完全按照某个词典的词条来标注音节的,
所以对于多音字造成的错误无法识别出来,如果是对篇章进行拼音标注,可能就不会出现这种很容易发现的错误标注. 当然还有另外一种解释,就是”局长”是故意被百度提示出来可能的正确提示词汇,因为考虑到南方人”zh”和 “ch”等前后鼻音分不清么,那么是这样的么?我们继续测试到底是何种情况.是百度有错误还是这是百度的先进的算法?

  我们考虑词汇”长大 “,故意错误输入为”赃大”,如果百度考虑到了前后鼻音的问题,那么应该会提示”长大”,但是百度提示是”藏大”.这说明什么?说明百度并没有考虑前后鼻音问题,根本就是系统错 误. 我们输入查询”悬赏”,故意将之错误输入为”悬桑”,没有错误提示,说明确实没有考虑这种情况.前鼻音没有考虑,那么后鼻音考虑了么,我们输入”:经常”,故意改为后鼻音 “经缠”,百度提示为”经产 经忏”,还是没有考虑后鼻音.这基本可以确定是百度系统的错误导致.

  根据以 上推导, 我们可以得出如下结论:百度是将分词词典里面每个词条利用拼音标注程序标注成拼音,然后形成同音词词典,所以两个词典是同样大的 ,而且这个词典也随着分词词典的增长而在不断增长. 至于标注过程中多音字百度没有考虑,如果是多音字就标注成多个发音组合,通过这种方式形成同音词词典.这样的同音词词典显然包含着很多错误.

 最后一个问题:百度对于英文进行拼写检查么?让我们试试看,输入查询”china”,不错,搜到不少结果,专注中文搜索的百度还能搜索到英文,真是意外的惊喜.变换一下查询”chine”,会更加意外惊喜的给我们提示”china”吗?
百度提示的是: 吃呢持呢,原来是不小心触发了百度的拼音搜索功能了.那么拼音搜索和中文检查错误是否采用同一套同音词词典呢,让我们来实验一下,搜索”rongji”,
百度提示” 榕基 溶剂 容积”,OK,换个中文查询”容机”,
百度提示” 榕基溶剂容积”,看来使用的是同一套同音词词典.也就是说百度的中文纠错和拼音检索使用的机制相同,中文纠错多了一道拼音注音的过程而已.难道这就是传说中那个百度的”事实上是一个无比强大的拼音输入法”的拼音提示功能么?
  最后让我们总结归纳一下百度的拼写检查系统:
  后台作业: (1)前面的文章我们说过,百度分词使用的词典至少包含两个词典一个是普通词典,另外一个是专用词典(专名等),百度利用拼音标注程序依次扫描所有词典中的每个词条,然后标注拼音,如果是多音字则把多个音都标上,比如”长大”,会被标注为”zhang da/chang da”两个词条.
  (2)通过标注完的 词条,建立同音词词典,比如上面的”长大”,会有两个词条: zhang daà长大” , chang daà长大.
  (3)利用用户查询LOG频率信息给予每个 中文词条一个权重;
  (4)OK,同音词词典建立完成了,当然随着分词词典的逐步扩大,同音词词典也跟着同步扩大;
  
  拼写 检查:
  (1)用户输入查询,如果是多个子字符串,不作拼写检查;
  (2)对于用户查询,先查分词词典,如果发现有这个单词词条,OK, 不作拼写检查;
  (3)如果发现词典里面不包含用户查询,启动拼写检查系统;首先利用拼音标注程序对用户输入进行拼音标注;
   (4)对于标注好的拼音在同音词词典里面扫描,如果没有发现则不作任何提示;
  (5)如果发现有词条,则按照顺序输出权重比较大的几个提 示结果;
  
  拼音提示:
  (1)对于用户输入的拼音在同音词词典里面扫描,如果没有发现则不作任何提示;
  (2)如果 发现有词条,则按照顺序输出权重比较大的几个提示结果;

上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度分词算法步骤还是过于繁琐,所以进一步进行分析,看看是否前面的推导有错误.

那么以前的分析有什么漏洞呢?
我们推导百度分词有反向最大匹配的依据是百度将”北京华烟云”分词为<北,京华烟云>,从这里看好像采用了反向最大匹配,因为正向最大匹配的结果应该是<北京,华,烟云>,但是由此就推论说百度采用了双向最大匹配还是太仓促了,前面文章我们也讲过,百度有两个词典,一个普通词典,一个专有词典,而且是专有词典的词汇先切分,然后将剩余片断交给普通词典去切分.所以上面的”北京华烟云”之所以被切分成<北,京华烟云>,另外一个可能是:京华烟云这个词汇是在专有词典里面存储的,所以先分析,这样得出”京华烟云”,剩下”北”,没什么好切分的,所以输出<北,京华烟云>.

这里只是假设,那么是否确实”京华烟云”在专有词典呢?我们再看一个例子”山东北京华烟云”,百度切分的结果是<山东,北,京华烟云 >,如果”京华烟云”在普通词典,如果是反向切分,那么结果应该是<山,东北,京华烟云>,如果是正向切分应该是<山东,北京, 华,烟云>,无论如何都分不出<山东,北,京华烟云>.这说明什么?
说明”京华烟云”是在那个专有词典,所以先切分出”京华烟云”,然后剩下的”山东北”交由普通词典切分,明显是正向最大匹配的结果输出<山东,北>.当然按照我们在第一篇文章的算法推导”山东北”的切分也会得出<山东,北>的结论,但是明显比正向最大匹配多几个判断步骤,既然效果一样,另外一个更加简洁的方法也能说得通,那当然选择简便的方法了.所以初步判断百度采取的是正向最大匹配.

我们继续测试采用何种分词算法,为了减少专有词典首先分词造成的影响,那么查询里面不能出现相对特殊的词汇,构筑查询”天才能量级”,这里应该没有专有词典出现过的词汇,百度切分为<天才,能量,级>,看来是正向最大匹配的结果.另外,如果所有查询词汇都出现在专有词典,那么采取的是何种方法?这样首先就得保证词汇都出现在专有词典,这么保证这一点呢?

我们构造查询”铺陈晓东方”,百度切分为<铺,陈晓东,方>,可以看出 “陈晓东”是在专有词典的所以先切分出来.另外一个例子 “山东京城”,百度切分为<山东,京城>,说明”东京”是在普通词典的.OK,构造查询”陈晓东京华烟云”,通过前面分析可以看出两个词汇都在专有词典里面,百度切分为<陈晓东,京华烟云>,说明对于专有词典词汇也是采取正向最大匹配或者双向最大匹配.那么使用反向最大匹配了吗? 构造查询例子”陈晓东方不败”,首先我们肯定”陈晓东”和”东方不败”都是在专有词典出现的,如果是正向切分,那么应该是<陈晓东,方,不败 >或者<陈晓东,方,不,败>如果是反向切分则是<陈,晓,东方不败>,可以看出百度的切分是<陈晓东,方,不败 >或者<陈晓东,方,不,败>,说明采用的是正向最大匹配.通过分析,百度的词典不包含”不败”这个单词,所以实际上百度的切分结果是 <陈晓东,方,不,败>,很明显这和我们以前推导的算法是有矛盾的,所以以前的分析算法确实有问题,所以结论是百度采取的是正向最大匹配算法.

重新归纳一下百度的分词算法系统:首先用专有词典采用最大正向匹配分词,切分出部分结果,剩余没有切分交给普通词典,同样采取正向最大匹配分词,最后输出结果.

另外,GOOGLE也是采用正向最大匹配分词算法,不过好像没有那个专用词典,所以很多专名都被切碎了.

从这点讲,GOOGLE在中文词典构建上比百度差些,还需要加把子力气才行,不过这也不是什么多难的事.
作者:风采依扬
原载:SEO服务

SEO优化技术的12个要点总结

SEO优化, 网站可用性, 网络收藏, 网络营销, 网页设计 No Comments »

一、选择服务器放在哪个区域
对于Google而言,不同的区域,搜索结果的就不同.一些英文关键词, 你在中国用Google搜索,发现你网站的排名非产靠前,但是如果你在国外用Google, 你可能翻十页都找不到你的网站.

我们做Google排名的排名效果不是让我们自己看的, 而是让我们的潜在客户看的. 所以服务器的区域选择应选择潜在客户群体所在的区域。

二、检查服务器的IP是否被Google处罚过
1、检查一下这台服务器上放了多少网站呢? 如何查呢?这里我们给你大家一个工具,可以很轻松的查出来有多少域名共同指向一个IP:(http://whois.webhosting.info/ip/)
例如: 如果你要查219.235.2***.75 这个IP你只要在IT地址栏入:
http://whois.webhosting.info/219.235.2***.75/
点击回车, 以后就可以看到这个有多少域名指向了这个IP

2、选择几个www.###.com 然后你在Google中输入:site:www.###.com 然后看一看Google收录了这个网站多少页面。如果发现Google还没有收录它,就多查几个,如果大部分都是没有被Google收录的话,那么很有可能这台服务器是被Google处罚过的。为了保险期间,最好别用。一般而言,被google处罚的域名比较多,被Google处罚的服务器相对比较少!

三、服务器运行一定要稳定

四、选择好的域名,合理设计网站路径和文件名
域名/路径/文件名的设计原则:
1、那就是要包含关键词。排英文关键词的话,你可以选择与关键词相关的域名.排中文关键词的话,可以用汉语拼音域名,中文网站别人用中文路径和文件名
2、静态的路径比动态的路径有利于排名
3、顶级域名比二级域名有路径排名(知名网站,权威网站的二级域名除外)
4、abc.web.com比www.web.com/abc/有排名优势
5、www.web.com/abc/比www.web.com/abc.html这样的路径有排名优势.

五、合理设计网页标题与标签:
标题和标签主要是指网页源代码中与中间的部分内容. 例如我们的网络营销策划网的首页的标题和标签如下:
1、网页标题设计原则:
a、每个网页的标题都要不同,并且要与自身网页的内容像符合;
b、网页标题设计简介明了,每个页面的标题最好只终点突出1-2个关键词,不要太多;
c、标题设计不要太长,最好不要超过25个汉字, 50个英文字母。

2、网页描述标签的设计:
网页描述标签,它主要是给搜索引擎看的,这个标签设计追求简单明了,与该网页内容相符合。为了提高排名,可以适当在里面提高关键词的密度。

3、关键词标签的设计:
目前对Google已经没有什么作用了,不过对其他搜索引擎的排名还有一定的作用,这个标签的设计原则和是简介明了,如果是多个关键词,可以用英文逗号格开,无关的关键词最好别用,容易被一些搜索引擎当作左臂来处理。

4、网页编码和语言注释标签设计:
主要是给浏览器看的。不同语言的编码都不同,所以做外文网站的时候一定要注意,最好用潜在客户使用的操作系统的编码,要不然潜在客户看到的网页将是乱码。如果你的网站是英文网站,你的潜在客户是针对西欧的,你可以用以下代码:

六、提高PR值

PageRank 技术:通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。

PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。

七、合理设计网站链接结构
合理的网站链接结构有一下特点:
1、拥有一个网站地图,网站地图链接向所有的网页,所有的网页上有一个链接指向网站地图页面;内容要小于100K。
2、网站导航清晰明了,方便用户浏览;
3、链接不用FLASH按钮和图片,而是使用文本。

八、增加反向链接策略
1、查看反向链接:在搜索框中输入:link:www.sdseo.net
2、增加网页的反向链接的方法:
和相关网站进行链接交换
到相关网站可以添加反向链接的网页上添加
将网站加入到世界著名分类目录网站中

3、选择链接网页的原则:
PR值非常高的页面
PR值不是太高,但是导出链接比较少的页面
权威网站的主要页面

九、网站内容与网页设计

优秀的网站内容主要包括以下一种:
1、原创内容较多,容易被众多网站引用,引用的过程中一般都会给这个页面加有链接,所以这个页面可以获得较好的评分,排名自然会好;
2、网站内容丰富:丰富的网站内容会让Google收录网站许多内容,网站各个页面之间的链接有利于其提高网站各个页面的在Google中的评分;
3、网站结构清晰明了,页面设计合理,容易被用户浏览和被Google搜索引擎爬虫爬行;
4、将asp转化成html,并且压缩减肥 每个页面不要大于100K, 导出链接要小于100个。

HTML格式的静态页面容易被搜索引擎收录,并且容易获得较好排名;
HTML格式的静态页面比较节省你的服务器资源,不怕你网站人气增加的快;
Html格式的静态页面不需要调用数据库、用户浏览起来速度非常快。

目前,大部分网站都采取用了新的技术,那就是后来是动态程序,前台是静态页面。虽然前台是html的,但是他们也可以通过后台来修改。
如果你的网站是商城系统或者其他的系统,很难断时间内改版,你还可以采取以下策略:那就是通过技术手段把news.asp?id=234 这样的链接映射成 news/234.html
这个技术非常简单,你只需要在服务器上装一个 ISAPI REWRITE (Google888.com 有免费下载)、然后进行相应的参数设置就OK

十、突出网页中的关键词:
1、大标题中要包含关键词:大标题是网页头部用
注释的网页标题;
2、<{#imeinline} style=”LINE-HEIGHT: 150%” align=”left”>网页文本中的关键词要专门突出:可以用来突出,也可以用醒目的颜色来突出;
3、合理调整页面的中关键词出现的频率,一般而言,关键词在网页中出现的频率保持在
3%-5%比较好。

十一、写好robots.txt文件
一个放在网站根目录下面给搜索引擎爬虫指路的文件,如果你一不小心写错了,有可能Google把你所有的网页都给删除掉了。关于这个文件内容的写法,Google网站有详细的说明:http://www.google.com/intl/zh-CN/remove.html

十二、增加超链接注释
title=”注释内容”
不加注释的代码:
电子商务指南
加注释后的代码::
电子商务指南

图片注释标签:一般网页中插入一张图片在html的代码如下:

可以将图片加上注释,如下:
ALT注释一定简介明了,千万不要写的太过冗长,这样会被一些搜索引擎当作作弊来对待的.

文章来源于网络,如作者看到本文,请联系丁丁

影响网页PR值的因素

SEO优化, 网站可用性, 网络收藏 No Comments »

影响网页PR值的因素有很多,但主要的有:
一、网站外部链接的数量和质量
  Google在计算PR值时,会将网站的外部链接数量考虑进去,但并不是说一个网站的外部链接数越多其PR值就 越高,因为网页的PR值并不是简单地由计算网站的外部链接数来决定的,还要考虑外部链接的质量,与相关网站做 交换链接的分值要比与一般网站做敛接的分值高。让我们来看一下PR值的计算公式:
    PR(A)=(1-d)+d(PR(t1)/C(t1)+…+PR(tn)/C(tn))
  其中PR(A)表示的是从一个外部链接站点t1上,依据PageRank系统给你的网站所增加的PR分值;PR(t1)表示该 外部链接网站本身的PR分值;C(t1)则表示该外部链接站点所拥有的外部链接数量。大家要谨记:一个网站的投票权 值只有该网站PR分值的0.85,而且这个0.85的权值平均分配给其链接的每个外部网站。设想我们的一个网站,被链 接至PR值为4,外部链接数为10的网站,则计算公式如下:
    PR(AKA)=(1-0.85)+0.85*(4/10)=0.15+0.85*(0.4)=0.15+0.34=0.49
  也就是说,如果我的网站和一个PR值为4、外部链接数为10的网站链接,最后我的网站将获得的PR值为0.49。 再让我们看看如果我们网站获得的是一个PR值为8,外部链接数为32的网站的链接,那么我将获得的PR分值将是:
    PR(AKA)=(1-0.85)+0.85*(8/32)=0.15+0.85*(0.25)=0.3625
  上述两个例子表明,外部链接站点的PR值固然重要,该站点的外部链接数也是一个需要考虑的重要因素。在建 设你自己网站的外部链接时,应尽可能找那些PR值高且外部链接数又少的网站,而且同你网站的内容相近。这样一 来你网站上这样的外部链接站点越多,你的PR值就会越高,从而使得你的排名得到显著提升。
二、网站被三大知名网络目录DMOZ,Yahoo和Looksmart收录
  众所周知,Google的PageRank系统对那些门户网络目录如DMOZ 、Yahoo和Looksmart尤为器重。特别是对 DMOZ。一个网站上的DMOZ链接对Google的PageRank来说,就好象一块金子一样有价值。如果你的网站为ODP收 录,则可有效提升你的页面等级。
  如果你的网站为Yahoo和Looksmart所收录,那么你的PR值会得到显著提升。如果你的网站是非商业性质的或 几乎完全是非商业性质的内容,那么你可以通过zeall.com使你的网站为著名的网络目录Looksmart所收录。
  如果你是一个网站管理员,而你的网站又已经收录在三大知名的开放目录DMOZ、Yahoo和Looksmart中,我想 你的网站的PR值一定比较高,而且搜索排名也不会差。
三、Google抓取您网站的页面数量
  让搜索引擎尽量多的抓取你网站的网页,这样搜索引擎才会认为你网站的内容非常丰富,因为搜索引擎喜欢内 容丰富的网站,才会认为你的网站很重要。seo培训博客每周都会发布一些原创的文章. google搜索site:spiderseo.com.cn 可以看到google对seo培训博客的收录量.而且这些内容最好是原创的文章,因为搜索引擎同样喜欢原创的东西。

四、放一些DPF格式的文件
  因为PDF格式的文章大多都是学术性的文章,具有一定的权威性,所以对于Google来说,PDF格式的文件下生的PR值就是3。

客户应该知道的事实
  其实,PR值只是Google对网站重要性的一个评测,如果一个网站的PR值高,那么Google对这个网站的刷新频率要高,对实际的排名不起决定性因素,而且PR值只对Google有效,对于其他搜索引擎不起任何作用,所以要想有好的排名还得注重网站的结构、外部链接资源和网页的内容,PR值不是神话,针对搜索引擎也不是最终目的,而是 目标用户,这样才能提升网站的销售能力,这才是搜索引擎优化的最终目的。

google排名优化圣经

SEO优化, 网站可用性, 网站策划, 网络收藏, 网络营销, 网页设计 No Comments »

让我们跳过理论来看看实际对Google有效的方法。我知道下面的这个系统对Google来说,每一次都有效,而且对所有的关键词都有效。这个系统 是我给客户做网站时所应用的,而且百试不爽。成功的程度当然也取决于网站所在的行业,潜在市场和竞争水平。下面的要点可以让你仅仅依靠Google,在一年的时间里,打造一个成功的网站。

a)准备工作和建立内容。
在你注册域名之前,你就应该记录下你的想法,应该准备足够100个网页的内容。请注意是至少。这100个网页应该是真正的内容,而不是链接页,关于我们页,联系我们或者版权声明等等杂七杂八的网页。

b)域名。
你应该选择一个很容易建立品牌的域名,你要的是Google.com,而不是关键词.com。充斥关键词的域名应该被丢弃,易于建立品牌的和容易辩识的域名才是最好的。
域名当中所包含的关键词作用现在非常之小。为什么goto.com改名为overture.com,那次改名是我所见过的,最大胆的策略之一。这个改名的策略摧毁了几年时间所建立的品牌。

c)网站设计越简单越好。
一个指标是文字内容的比重应该大于HTML格式的比重。整个网页应该规范化,应该在所有的浏览器上显示正常。比如使它符合HTML3.2标准。搜索引擎蜘蛛还并不太喜欢HTML4.0标准。
应该远离那些太重的因素:flash, dom, java script等。如果你必须要使用这些脚本的话,把他们作为外部文件来使用。在我看来,根本没有必要使用这些东西。这些东西几乎不能给一个网站增色,却会 极大的从各个方面伤害网站的表现(搜索引擎友好问题只是其中之一)。
用逻辑的方式安排你的网站,可以在目录名当中使用关键词。你也可以采用另外一种方法,也就是把所有的网页都放在根目录当中(这种方法很少见,但是事实证明是非常好的有效的方法)。
不要让你的网站堆砌一大堆没用的东西,比如说建议使用什么什么浏览器,或者计数器等等,使它保持最简单化,看起来专业化。向Google自己学习,看看他的主页,简单的没法再简单了。这也正是人们所需要的。
速度不是最重要的因素之一,而是唯一的重要因素。你的网页应该非常快速,如果你的网页会延时3,4秒钟,你就完蛋了。当然如果你的主机和访客在不同 的国家, 3,4秒钟还有情可原,对当地的访客来说,3到4秒钟的下载时间已经是极限了。超过这个时间,每多一秒钟,你就会丧失10%的流量。而这10%的流量可能 正是成功与失败的分野。

d)网页大小
越小越好,最好保持在15K以下。越小越好,最好保持在12K以下。越小越好,你最好保持在10K以下。你明白了我的意思了吧。比5K大,小于10K,这是最好的。很难做到,但是却是最有效的。对搜索引擎优化也有效,对访客也有效。

e)内容
每天建一页两百到五百字的网页。如果你不知道该写些什么的话,做点关键词调查,然后根据你所得到的热门关键词写文章。

f)密度,位置等等
简单老式的SEO,在这些地方用一次你的关键词:网页标题,说明标签,正文标题,网址URL,黑体,斜体,网页的最开始。关键词密度介于5%到20%之间 (也别太在意)。写出好的文章,并且检查错字。拼写检查(对中文来说,检查错字)正在变得越来越重要。因为搜索引擎已经开始运用自动纠错功能,所以已经没有可以写错别字的借口了。

g)导出链接
在每一个网页连向一到两个排名高的网站,在链接文字当中加上关键词(这一点对未来来说很重要)。

h)网站内的交叉链接
指的是同一个网站内的链接。在你的网站之内,高质量的内容之间互相链接起来。如果一个网页是关于食物的,那么你应该确保这页连向关于苹果的和蔬菜的那些页。尤其对Google来说,基于共同内容的相互链接对在你的网站之内分享PR是非常重要的。
你要的不是使其他网页黯然失色的一个全明星网页,你需要的是50个每天吸引一个访客的网页,而不是一个每天吸引50个访客的网页。如果你发现你的网 站里面有一页,确实是吸引大部分流量的页,那么你就应该把这一页的PR值通过交叉链接,分散到其他网页上。这有一点像老话说的分享财富。

i)开通网站
最好不要使用虚擬主机。最好使用你自己的单独的IP地址。确保你的网站可以被搜索引擎蜘蛛所索引。所有的网页都应该连向你网站里其他的网页。所有的网页距离主页都不应该超过两次点击。所有内容页也都应该链接回主页。一个在所有页上都存在的菜单系统,应该链接到你的网站上的主要部分。
在你完成一个高质量的网站之前,不要把它开通。开通一个不好的网站,比不开通网站更糟糕,你要的是从一开始就是一个优秀的网站。
申请登录开放目录,如果你有预算的话,也申请提交到雅虎和其他付费目录。如果没有预算的话,可以试试雅虎的免费提交,但是不要抱太大希望。

j)网站提交
把主页提交到Google等搜索引擎,然后接下来六个月就忘了这件事。没错,提交,然后忘了它。

k)记录和跟踪
使用一个高质量的能够记录访客来源的日志分析软件。如果你的主机提供商不提供访客来源,你就应该使用另外一家主机提供商。

l)观察蜘蛛
观察来自搜索引擎的蜘蛛们,确保蜘蛛在爬行你的整个网站。如果不是的话,你应该检查你的所有链接系统,确保蜘蛛能发现你整个的网站。如果搜索引擎需要两次才能检索完你的网站,你也不要害怕。对很多搜索引擎来说,可能需要六个月才能发现和爬行你的网站。

m)主题性的分类目录
几乎每一个行业都它自己的权威分类目录,去提交到这些分类目录当中。

n)链接
到Google版本的开放目录查看一下你的网站所在的行业,找到那些可以免费交换链接的 网站,要求和这些网站交换链接。在主题性的网页上选择一段内容做为链出的文字。如果那些网站的站长不愿意和你交换链接,也没什么,继续下一个。每一天与一 个新的网站交换链接,一个很简短的个人化的邮件就足够了。如果某个网站不愿意链接向你,别把它当回事-实际上早晚有一天他们会的。

o)内容
每天一页高质量的有内容的网页。有实效性的有主题的文章永远是最好的。避免太多博客型的个人化的东西,应该写更多文章类型的普通观众愿意看的内容。
提高你的写作技巧,学习适合网上人群的写作方式,多分段,短句子,读起来快的内容。大部分的网站访客不是读,而是浏览。这也就是为什么短的文章很重要。如果你看到一大篇不分段的文章,很多人马上就会按返回按纽了。
人们不会浪费15秒的时间,来了解你的花里唬哨的菜单系统是怎么工作的。某一个大公司的网站放上一个flash菜单系统,并不意味着你也必须这么做。
使用标题,使用黑体来强调重点,并且也是逻辑分割。

p)秘密武器
离所谓的秘密武器,或者今天有用明天就没用的东西远一点。不要用任何看起来像垃圾的东西,任何不道德的,或任何接近于作弊手段的东西。

q)导出链接
当你收到交换链接请求的时候,要仔细查看对方的网站,不要轻易就链接回去。通过Google查看他们的网站,并看他们的PR值。不要链接到有问题的网站和质量不高的网站。确保对方网站和你的类似,是同一个行业的。

r)丰富你的网站
可以用一些内容丰富你的网站。比如说推荐网页给你的朋友,论坛,邮件列表,电子杂志等等。去看一下你本行业的论坛,读的越多越好,直到你读不下去了。

s)注意小册子类型的网站
如果你运行的是电子商务网站,或者你有一个真正的店面,想把生意扩充到英特网上,要注意不要把你的网站做成一个宣传手册。想想人们需要什么,访客不 是来你的网站看你的内容,他们是来你的网站寻找他们自己所需要的内容。在你的文章当中,尽量少谈你自己和你的产品(我知道你在怀疑,你自己好好想想)。

t)每天增加一个网页
回到关键词研究,找出好的点子,写新的网页。

u)研究日志文件
过了30到60天之后,你应该开始从已经被登录的地方得到一些访客。仔细看一下,人们是用什么关键词搜索找到你的网站的?是不是有一些很莫名奇妙的关键词组合?为什么人们会用这些关键词找到你的网站呢?有没有什么东西是你所忽视了的呢?很有可能你应该以这些为主题,创建更多的网页。
仔细研究你的网站和日志,给搜索引擎需要的网页。搜索引擎会准确的告诉你,他们想要什么。你要仔细的看,在你的网站日志当中有一座有待开发的金矿。

v)实效性的话题
在你的行业当中,永远走在别人前面。比如说如果一个大公司Z,在年底要推出产品A,那你可以在十月份之前就做好一个网页,是关于产品A的。那么在十二月份之前,搜索引擎就已经收录了这个网页。

w)朋友和家人
社交联系网络对一个网站的成功也非常关键,这也是你看那些论坛的时间要得到回报的时候了。仅仅是看永远是没什么用的,论坛的价值就在于和其他的同事及网友交流。通过交流,你可以得到长远的利益,而不是仅仅读论坛。这种交际网络也会通过其他方面得到回馈。比如说导入链接小窍门,电子邮件交换意见,成为这个行业的专家的可能性等等。

x)记录
如果你每天增加一个网页的话,你会发现有的时候,一个好主意突然就出现了,没准你正在洗澡(先擦干了),正在驾车(先把车靠在路边)或者也许就在桌子上趴着。当一个好的点子出现的时候,把它记下来。不然十分钟以后,你就会忘了你刚想起来的主意。
要把它先记下来,然后再把细节写出来。当你没什么好点子的时候,把这些记录拿出来。这听起来很简单,但是却是一个屡试不爽的好主意。

y)六个月的时候,检查提交的网站
看一下你所提交过网站的地方,是不是收录了你的网站。如果还没有的话,就再提交一次,然后再一次忘记。试一下那些免费的分类目录。

z)每天建增加一页高质量的网页
这一点已经重复好几次了,Google喜欢内容,大量的高质量的内容。以一系列关键词为基础的广泛的内容。在经过一年以后,你应该已经有了400页左右高质量的内容。这些内容应该使你的网站在很广泛的关键词里面得到好的排名。

作者: Zac@SEO每天一贴
原载: 中新虚拟主机

新站如何被百度收录

SEO优化, 网站策划, 网络收藏, 网络营销, 网页设计 No Comments »

前几天,群里朋友想提高PR,所以做了个PR专题,大部分朋友看了以后都比较满意.最近遇到了好多新站长,他们刚刚开始做站,对于seo还不太了解.建议新站长学习seo的过程中要多注意实践,不要只听理论.seo培训博客会根据大家的需要整理以下文章,帮助大家学习.蜘蛛他本人比较忙,所以很少写文章,根据他的要求,我把整理的文章内容都仔细检查过,确认文章的价值及有效性,才会发布.所以大家放心阅读.

很多站长朋友苦于自己的新站总是很长一段时间不被搜索引擎所收录,甚至GG收录一周后依旧不见百度蜘蛛的到来,今天我就总结下这个问题,希望能够对大家有所帮助.由于时间关系,我就暂时不发布实例咯, 欢迎大家交流指点

1.网站建设完成后再向百度提交你的申请

2.网站早期的内容要保证80%原创化,即不能够复制网上已经重复千百次的内容.
2.1 原创化不等于原创,你可以将复制过来的内容加一修改,使之接近原创化.一般来说,需要修改文章的正文前200字,标题.关键词和描述也最好自己去写. 具体可以参考seo培训博客的示例.
2.2 原创化的效果一定比不上原创文章,但是同样会得到搜索引擎的收录,而采集后未经编辑的文章只有很少的一部分能够被搜索引擎收录.
2.3 原创化可以是复制其它站上的某一篇文章加一修改,也可以是找多个网站的同一主题的文章,然后手工整理,使之形成一篇新文章,这样做明显比单一复制某一文章再修改要好的多,.
3.为你的网站选择一个好域名,以及一个高速 稳定 安全的空间
3.1好的域名一般要满足三个条件
3.1.1域名本身就是行业关键词或者热门关键词(这样的域名很多都已经被注册了,用于投资,此时你可以注册看似冷门的关键词,就像 cet这样的词一年前并没有多大意义,但是今天却能够带来很多流量). 行业词汇做域名,可以无形中提高网站在搜索引擎中的地位.
3.1.2 域名最好是.com,如果你所想的.com米已经被注册,建议换个思路,注册其它.com米,实在不行,再考虑cn和net的米
3.1.3因为3月以来的1元CN域名活动,使很多人手里都有好几十个CN米,很多人都用CN来做垃圾站,所以目前百度对CN米的审核非常严格,一般的站,如果很多内容是采集的,也许根本就不会被百度收录.
3.1.4所有的玉米中,gov.cn / edu.cn 在搜索引擎尤其是百度中被收录的几率要比其它米大,可以理解为他们是天生皇族;除此之外,org要比net要比com容易被收录.
3.2
空间必须是好的,如果你打算做一个优秀的网站而不是垃圾站.空间的大小无所谓,够用就好,关键是空间的质量.我们常常不会去理会1分钟左右都还没有打开的站,所以空间的速度很重要.要是你的站天天被挂马,你的访客会越来越少,所以空间安全很重要.
如果选择的是虚拟主机,要事先查查同一台服务器上的站有没被百度K,如果有,建议不要买这台服务器上的空间.

4.合理的清晰的网站结构,让游客和搜索蜘蛛都可以顺利地阅读你网站所有前台页面.(seo培训博客重点提醒一下本条建议.)
5.尽可能多地结交高质量的外部连接,如同行网站的友情连接,网站早期如果找不到同行站的友情连接,可以发布相关文章到同行站,再在所发布的文章中带一个自己的网站连接.
6.检测用户的行为,比如用户从那里来,来干什么,什么主题的内容最受欢迎. 及时提供用户需要的资源,而不是一味地以自己的设想来更新.
7.坚持每天更新,更新数量在10篇左右.

作者:酷影小何
原载:http://www.ky530.com/blog/

结合seo制作一个新网站

SEO优化, 网站可用性, 网络收藏, 网页设计 No Comments »

不少新站长都开始被seo所吸引.但seo是一个说难不难,说简单不简单的话题.重点在于大家对seo的认识角度不同.很多站长半路出家,对seo半知不解,操作起来忽东忽西。本文是从网站站长的角度来分析,指导大家从建站初期就与seo密切结合,合理利用seo来制作一个完美的网站.大家可以根据自己的兴趣和爱好,按照教程重新制作一个网站,与教程同步进行.

#本文适合初级站长阅读,中级站长请路过,seo专业人员无需阅读.

一:网站制作前期

首先要确定的是网站的定位,切忌不要做大而全的网站。因为你将来会发现自己心有余而力不足。其实能做好某一个小小的方面,也是成功的。记住:专注才能更快的走向成功。网站定位因人而异,大家自行考虑。

网站定位好,就要根据自己的计划分析出一个核心的关键词。你网站是做什么内容?然后提炼出一个词。比如科幻小说,手机游戏,服务器合租等等。

接着,来注册一个合适的域名。如果你想做大,长期发展,那么com是首选。尽量让域名包含关键词,为以后的seo做好基础。域名包含关键词的效果,大家有目共睹。大家可以用拼音或者英文形式将关键词表达出来。也许加了关键词,这个域名似乎价值低了,但对于seo来说却百利而无一害。注册域名推荐大家到http://www.ename.cn那里自由过户,com米50元,很方便。

然后,就应该选择一个合适的网站程序。推荐使用kingcms(asp)或dedecms(php)或iwms(.net),因为它们都各有优点,比较方便seo。去买一份合适的空间,然后将网站程序上传。推荐92服务器合租网http://www.92hezu.com 他们是双线的,速度不错,我在站长中国看到的广告,8折买的。
二:网站框架修改

将网站程序适当修改,然后使用一套自己喜欢的风格模板。上面提到的各个程序官方网站或论坛都已经提供了不同的模板,也有不少针对程序进行源代码改动的教程,请大家根据爱好自行修改。这里也有很多模板http://sc.chinaz.com/html/WebTemplets/index.html

尽量让分类栏目都各自在一个独立的目录,不要把所有页面都堆积到根目录。一是方便管理,二是为了烘托栏目权值。至于其另外一个目的,下面会继续提到。

网站首页和每个目录的首页都要设置不同的标签(title/keywords/description等),这个千万要记住。如果你是采集的话,内页只需要设定标题不同就可以了,其他标签如果重复反而不如不加。

页面文字重要性顺序为从上到下,从左到右。这个说话没有实际依据,但在seo圈子里是大家默认的结论。有疑问的话,可以百度一下“seo 金三角”,也许大家就能明白了。

网站导航一定要做好,让用户和搜索引擎都能方便的找到自己需要的内容。推荐使用文字导航,另外在网站最好有个明确的导航路线,告诉用户他们现在在什么地方。比如:“首页 → 栏目名字 ”,其实这个功能在各个cms系统基本上都集成了。

还有一个问题需要注意:在你网站制作完以前不要及早发布,否则会有很多意外的麻烦。发布的时候,不需要带太多页面,只需要带上十几个基本的页面足够了。等搜索引擎收录以后再更新也不晚。

不知道为什么会有很多人抱怨让搜索引擎收录难,其实收录很简单。一般正常的新站点,只要有一定的文字内容,在一个活跃站点出现一个外部连接,24小时内就会被收录。

三:网站内容填充

等搜索引擎收录自己的网站以后,就可以定期更新内容了。如果时间充足的话,建议大家每天都更新,更新数量根据自己的网站定位确定。如果你的网站主题本身内容话题少,每天更新一篇也可以。

更新的时候,一般seo都强调原创内容。但是个人站长毕竟精力有限,所以大家都不可能完全保证内容原创。所以大家更新的时候注意一下,可以将整理来的内容适当修改。

标题可以换的换个标题,实在不会换标题的,做个总结应该会吧?用两三句话把文章大意总结出来,做为内容简介/导读。末尾可以加一下自己的“版权”:“本文来自???,xxx网站***整理,转载请保留连接。”引号里???代表来源,xxx代表你的网站名字,***代表你的网址。另外,有的人提倡把内容分页,其实分页最初的目的是提高GG广告展示率,对seo伪原创起的作用很小。

连续更新几天,网站基本稳定,就可以为网站寻找外部连接了。外部连接的获取方法很多,常用的是交换友情连接,但是效果最好的是软文。一般对于不太热门的关键词,有二三十个独立网站的友情连接就足够了。至于获取外部连接的方法可以参考“增加反向链接的101个方法”。中文文字版页面 http://spiderseo.com.cn/seo/link101.html

四:网站后期维护

以后需要做的事情很简单了,更新网站内容和增加外部连接。更新网站内容时候不必须非去大的门户找,也可以自己写或者从一些个人博客寻找,因为重复性高的内容增加了价值也不大。至于增加外部连接可以从上面那文档学习经验。

如果你能持之以恒,坚持更新两三个月。那么网站肯定能在搜索引擎中得到不错的排名。根据你维护的水平和关键词的热门程序,大约能达到500-30000IP.(比如如果做QQ空间代码,繁体字等词语,轻松可以达到几万IP;但如果做一些技术性,产品性的词语却只能每天几百IP.)到这个时候可以考虑投放广告了,推荐大家去http://top.admin5.com/u/看看那里的网站联盟,信息很全。

本文没有强调seo技巧,原因在于文章定位于初级站长,目的仅在于指导大家如何建立一个新网站。语言比较笼统,但都是经验之谈.

#本文适合初级站长阅读,中级站长请路过,seo专业人员无需阅读.
#本文原意是为了指导一个网友建立网站,但出于共享目的,所以发布.
#本文版权归所有看到本文者所有,转载勿恶意改动文章,请保留版权.

作者:234 来源:http://www.im286.com/thread-2199123-1-1.html