<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>孙波的沙盒子 &#187; 搜索引擎优化</title>
	<atom:link href="http://www.sunbo.name/tag/%e6%90%9c%e7%b4%a2%e5%bc%95%e6%93%8e%e4%bc%98%e5%8c%96/feed" rel="self" type="application/rss+xml" />
	<link>http://www.sunbo.name</link>
	<description>Bourne&#039;s sandbox</description>
	<lastBuildDate>Wed, 04 Jan 2012 08:15:34 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>Google测试新功能：搜索结果随用户正在输入的内容即时更新</title>
		<link>http://www.sunbo.name/20100822/live-updating-google-search-results</link>
		<comments>http://www.sunbo.name/20100822/live-updating-google-search-results#comments</comments>
		<pubDate>Sun, 22 Aug 2010 13:10:21 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[网络经济]]></category>
		<category><![CDATA[用户体验]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[互联网升级]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/?p=2466</guid>
		<description><![CDATA[据说Google正在小范围的开放给google lab的用户测试这项新功能：在Google搜索时，不再需要点击搜索或者敲回车，而只需要在搜索框中正常输入你要找的内容，搜索结果就会根据你输入的内容即时发生变化。 据称这项新功能测试后才会有上线的时间公布出来。我们可以看一下有已经体验过的人做的视频：]]></description>
			<content:encoded><![CDATA[<p>据说Google正在小范围的开放给google lab的用户测试这项新功能：在Google搜索时，不再需要点击搜索或者敲回车，而只需要在搜索框中正常输入你要找的内容，搜索结果就会根据你输入的内容即时发生变化。</p>
<p>据称这项新功能测试后才会有上线的时间公布出来。我们可以看一下有<a href="http://www.ousbey.com/blog/live-updating-google-search-results" target="_blank">已经体验过的人做的视频</a>：</p>
<p><center><embed src="http://player.youku.com/player.php/sid/XMjAwMDY0ODA4/v.swf" quality="high" width="480" height="400" align="middle" allowScriptAccess="sameDomain" type="application/x-shockwave-flash"></embed></center></p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20100822/live-updating-google-search-results/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>忽然发现博客的Sitelink变化了。</title>
		<link>http://www.sunbo.name/20100621/%e5%bf%bd%e7%84%b6%e5%8f%91%e7%8e%b0%e5%8d%9a%e5%ae%a2%e7%9a%84sitelink%e5%8f%98%e5%8c%96%e4%ba%86%e3%80%82</link>
		<comments>http://www.sunbo.name/20100621/%e5%bf%bd%e7%84%b6%e5%8f%91%e7%8e%b0%e5%8d%9a%e5%ae%a2%e7%9a%84sitelink%e5%8f%98%e5%8c%96%e4%ba%86%e3%80%82#comments</comments>
		<pubDate>Mon, 21 Jun 2010 07:19:49 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[Wordpress]]></category>
		<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[网络经济]]></category>
		<category><![CDATA[编辑Sitelink]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[Google Sitelink]]></category>
		<category><![CDATA[内链结构]]></category>
		<category><![CDATA[权重]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/?p=2430</guid>
		<description><![CDATA[﻿事情多起来，写博客的时间大多转移到了twitter和微博里。今天搜一个孙姓同事的名字顺便搜了下“孙波的沙盒子”，发现Sitelink由原来的单页面推荐变成了导航，很开心。（什么是Sitelink?），如果站点已经有了Sitelink的站长可以在Google管理员工具中对其进行修改和设置。]]></description>
			<content:encoded><![CDATA[<p>﻿事情多起来，写博客的时间大多转移到了twitter和微博里。今天搜一个孙姓同事的名字顺便搜了下“孙波的沙盒子”，发现Sitelink由原来的单页面推荐变成了导航，很开心。（<a href="http://www.dunsh.org/2006/09/28/google-sitelinks-2/" target="_blank">什么是Sitelink?</a>），如果站点已经有了Sitelink的站长可以在Google管理员工具中对其进行修改和设置。</p>
<div id="attachment_2431" class="wp-caption aligncenter" style="width: 735px"><a href="http://www.sunbo.name/wp-content/uploads/2010/06/sunbo.jpg"><img class="size-full wp-image-2431" title="孙波的沙盒子Sitelink" src="http://www.sunbo.name/wp-content/uploads/2010/06/sunbo.jpg" alt="孙波的沙盒子Sitelink" width="725" height="309" /></a><p class="wp-caption-text">孙波的沙盒子Sitelink</p></div>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20100621/%e5%bf%bd%e7%84%b6%e5%8f%91%e7%8e%b0%e5%8d%9a%e5%ae%a2%e7%9a%84sitelink%e5%8f%98%e5%8c%96%e4%ba%86%e3%80%82/feed</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>招聘SEO工程师/搜索引擎优化师 &#8211; 上海</title>
		<link>http://www.sunbo.name/20100613/seoer-sh</link>
		<comments>http://www.sunbo.name/20100613/seoer-sh#comments</comments>
		<pubDate>Sun, 13 Jun 2010 05:54:22 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[关于上海]]></category>
		<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[网络经济]]></category>
		<category><![CDATA[上海]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/?p=2427</guid>
		<description><![CDATA[替朋友招聘，国内知名互联网上市公司，工作地点上海。JD如下，有意者Email至：sunbo.name（at）gmail.com： SEO 搜索引擎优化师 职位描述： 1、熟悉搜索引擎运作原理和技术； 2、能够针对搜索引擎进行有效的关键字选择和优化； 3、能够基于搜索引擎需要对网站内容进行有效的优化； 4、能够进行技术传授和讲解 任职要求： 1、本科及以上学历，计算机相关专业或市场营销专业优先； 2、5年以上网络运营推广和搜索引擎优化工作经验； 3、掌握竞价排名、搜索引擎优化、交换链接、邮件推广、SNS推广、论坛推广及其它特殊的推广方式等手段； 4、具有较高的宣传文案撰写能力，文字基础扎实； 5、具备良好的的沟通、表达能力和人际交往能力； 6、良好的职业素质、敬业精神，能承受工作压力。]]></description>
			<content:encoded><![CDATA[<p>替朋友招聘，<strong>国内知名互联网上市公司</strong>，工作地点上海。JD如下，有意者Email至：sunbo.name（at）gmail.com：</p>
<p><span style="font-family: 宋体; font-size: xx-small;">SEO </span><strong><span style="font-size: xx-small;">搜索引擎优化师</span></strong></p>
<p><span style="font-family: 宋体; font-size: xx-small;"> </span></p>
<p><span style="font-family: 宋体; font-size: xx-small;">职位描述：<br />
1、熟悉搜索引擎运作原理和技术；<br />
2、能够针对搜索引擎进行有效的关键字选择和优化；<br />
3、能够基于搜索引擎需要对网站内容进行有效的优化；<br />
4、能够进行技术传授和讲解</span></p>
<p><span style="font-family: 宋体; font-size: xx-small;"> </span></p>
<p><span style="font-family: 宋体; font-size: xx-small;">任职要求：<br />
1、本科及以上学历，计算机相关专业或市场营销专业优先；<br />
2、5年以上网络运营推广和搜索引擎优化工作经验；<br />
3、掌握竞价排名、搜索引擎优化、交换链接、邮件推广、SNS推广、论坛推广及其它特殊的推广方式等手段；<br />
4、具有较高的宣传文案撰写能力，文字基础扎实；<br />
5、具备良好的的沟通、表达能力和人际交往能力；<br />
6、良好的职业素质、敬业精神，能承受工作压力。</span></p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20100613/seoer-sh/feed</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>PageRank信息从Google管理员工具中去除</title>
		<link>http://www.sunbo.name/20091016/pagerank-remve-from-google-toolbar</link>
		<comments>http://www.sunbo.name/20091016/pagerank-remve-from-google-toolbar#comments</comments>
		<pubDate>Fri, 16 Oct 2009 07:32:19 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[网络经济]]></category>
		<category><![CDATA[google]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/?p=2143</guid>
		<description><![CDATA[PageRank Distribution Removed From WMT.不晓得接下来是否会从toolbar中消失，敬请期待。(感谢三亚婚纱摄影对本沙盒子的投递) We&#8217;ve been telling people for a long time that they shouldn&#8217;t focus on PageRank so much; many site owners seem to think it&#8217;s the most important metric for them to track, which is simply not true. We removed it because we felt it was silly to tell people not to [...]]]></description>
			<content:encoded><![CDATA[<p>PageRank Distribution Removed From WMT.不晓得接下来是否会从toolbar中消失，敬请期待。(感谢<a href="http://www.edsy.com.cn/" target="_blank">三亚婚纱摄影</a>对本沙盒子的投递)</p>
<p>We&#8217;ve been telling people for a long time that they shouldn&#8217;t focus on PageRank so much; many site owners seem to think it&#8217;s the most important metric for them to track, which is simply not true. We removed it because we felt it was silly to tell people not to think about it, but then to show them the data, implying that they should look at it.  <img src='http://www.sunbo.name/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </p>
<p>More details on why not to obsess over PageRank here: <a href="http://sites.google.com/site/webmasterhelpforum/en/faq--crawling--indexing---ranking#pagerank " target="_blank">链接</a></p>
<p>来自<a href="http://www.sunbo.name/tag/google" target="_blank">Google</a> Employee的回复，原文大意为：</p>
<p>我们老早就告诉你们了，不要花这么多精力去关注PageRank，但还是有很多人乐此不疲，把研究这个当成是头等大事，这是一件不正确的事情，我们在工具条去掉了PageRank的数据，就是不想让大家每天都傻傻的盯着PR的展示，仅仅关注数字的高低而已。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20091016/pagerank-remve-from-google-toolbar/feed</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>招聘界面工程师一名（Web页面设计）</title>
		<link>http://www.sunbo.name/20090422/ui</link>
		<comments>http://www.sunbo.name/20090422/ui#comments</comments>
		<pubDate>Wed, 22 Apr 2009 14:52:23 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[网络经济]]></category>
		<category><![CDATA[网站]]></category>
		<category><![CDATA[招聘信息]]></category>
		<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[杭州]]></category>
		<category><![CDATA[互联网]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/?p=1752</guid>
		<description><![CDATA[我的一个杭州的朋友在招聘页面设计人员一名，公司有一定规模，主要从事互联网建设、搜索引擎优化等项目，公司规模在50人左右，老板人不错，待遇也不错，按个人实际能力可详谈。简历可以投递至我的邮箱我帮忙转过去： sunbo.name(at)gmail.com 岗位职责: 1. 独立设计和制作网站页面； 2. 与客户沟通和确认网站设计需求； 3. 负责公司自身运营的网站设计 职位要求: 1. 良好美术功底 、有一定的网站建设经验，美术专业毕业者优先； 2. 熟悉html、Flash，熟练使用photoshop、fireworks、dreamweaver等软件，会div+css； 3. 工作效率高，思维敏捷，擅长创意策划，善于沟通，良好团队合作； 4. 简历中请列举近期作品网址。要有平面设计作品及网页设计作品； 5　需要有两年左右工作经验。 注: 页面设计和HTML制作需要兼备，请各位只做视觉设计或只做前端开发的朋友勿投。]]></description>
			<content:encoded><![CDATA[<p>我的一个杭州的朋友在招聘页面设计人员一名，公司有一定规模，主要从事互联网建设、搜索引擎优化等项目，公司规模在50人左右，老板人不错，待遇也不错，按个人实际能力可详谈。简历可以投递至我的邮箱我帮忙转过去： sunbo.name(at)gmail.com</p>
<p><strong>岗位职责:</strong><br />
1. 独立设计和制作网站页面；<br />
2. 与客户沟通和确认网站设计需求；<br />
3. 负责公司自身运营的网站设计</p>
<p><strong>职位要求:</strong><br />
1. 良好美术功底 、有一定的网站建设经验，美术专业毕业者优先；<br />
2. 熟悉html、Flash，熟练使用photoshop、fireworks、dreamweaver等软件，会div+css；<br />
3. 工作效率高，思维敏捷，擅长创意策划，善于沟通，良好团队合作；<br />
4. 简历中请列举近期作品网址。要有平面设计作品及网页设计作品；<br />
5　需要有两年左右工作经验。</p>
<p>注: 页面设计和HTML制作需要兼备，请各位只做视觉设计或只做前端开发的朋友勿投。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20090422/ui/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Hitwise:搜索关键字越来越长</title>
		<link>http://www.sunbo.name/20090225/hitwise-changwei-guanjianci</link>
		<comments>http://www.sunbo.name/20090225/hitwise-changwei-guanjianci#comments</comments>
		<pubDate>Wed, 25 Feb 2009 02:52:22 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[网络经济]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[words]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/?p=1587</guid>
		<description><![CDATA[根据Hitwise的调查,所有搜索引擎的查询关键字都开始变得越来越长,当然主流的搜索关键字长度仍然为2个单词,在过去的12个月里搜索查询长于4个单词已经变得非常普遍. Hitwise公司最新的数据也显示,Google的搜索市场份额也在稳步增长,与去年同期相比增长了9%. 与去年同期相比,使用1个或者2个单词作为搜索关键字现在已经不那么流行,而使用&#8221;3个单词&#8221;作为搜索关键字的频率则没有什么变化.使用多个单词作为搜索关键字则是现在的流行趋势. 这是一个很有趣的趋势,也许人们都发现,使用更长的搜索关键字比较容易得到更准确的信息.   &#8212;-转自CNBETA]]></description>
			<content:encoded><![CDATA[<p style="text-align: left;">
<div class="mceTemp mceIEcenter" style="text-align: left;">根据Hitwise的调查,所有搜索引擎的查询关键字都开始变得越来越长,当然主流的搜索关键字长度仍然为2个单词,在过去的12个月里搜索查询长于4个单词已经变得非常普遍.</div>
<p>Hitwise公司最新的数据也显示,Google的搜索市场份额也在稳步增长,与去年同期相比增长了9%.</p>
<div id="attachment_1591" class="wp-caption aligncenter" style="width: 602px"><a rel="attachment wp-att-1591" href="http://www.sunbo.name/20090225/hitwise-changwei-guanjianci/attachment/1"><img class="size-full wp-image-1591" title="hitwise" src="http://www.sunbo.name/wp-content/uploads/2009/02/1.png" alt="hitwise1" width="592" height="328" /></a><p class="wp-caption-text">hitwise1</p></div>
<p>与去年同期相比,使用1个或者2个单词作为搜索关键字现在已经不那么流行,而使用&#8221;3个单词&#8221;作为搜索关键字的频率则没有什么变化.使用多个单词作为搜索关键字则是现在的流行趋势.</p>
<div id="attachment_1592" class="wp-caption aligncenter" style="width: 620px"><a rel="attachment wp-att-1592" href="http://www.sunbo.name/20090225/hitwise-changwei-guanjianci/attachment/2"><img class="size-full wp-image-1592" title="hitwise2" src="http://www.sunbo.name/wp-content/uploads/2009/02/2.png" alt="hitwise2" width="610" height="402" /></a><p class="wp-caption-text">hitwise2</p></div>
<div>这是一个很有趣的趋势,也许人们都发现,使用更长的搜索关键字比较容易得到更准确的信息.   &#8212;-转自CNBETA</div>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20090225/hitwise-changwei-guanjianci/feed</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>血性的淘宝，屏蔽了百度的爬虫&#8230;</title>
		<link>http://www.sunbo.name/20080907/taobao-pingbi-baidu</link>
		<comments>http://www.sunbo.name/20080907/taobao-pingbi-baidu#comments</comments>
		<pubDate>Sun, 07 Sep 2008 14:30:30 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[网络经济]]></category>
		<category><![CDATA[阿里巴巴]]></category>
		<category><![CDATA[百度]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/index.php/20080907/taobao-pingbi-baidu.html</guid>
		<description><![CDATA[今天偶亲自去看了下淘宝的Robots文件才相信，淘宝这个上亿级别网页，上亿级别流量的站点，真的屏蔽了百度的爬虫，虽然百度并不一定遵守robots文件协议，目前来看，百度依然收录着淘宝2270万的网页。详见图：   淘宝屏蔽百度爬虫的robots截图 百度对淘宝的收录数量截图 由于个人所在的职位，以及个人经历和喜好，我是绝对挺淘宝的，百度是个难以以德服人的公司，尤其在Google这样的竞争对手对比下。淘宝只是个开始吧，诸多网站已经厌倦了百度的惟利是图，当然，不能否认，还是很多愿意趋炎附势追逐利益的。（感觉像小学生在练习用成语，哈） 有句古话：得人心者得天下&#8230;.做不到公正、客观、不自私的话，不会成为受人喜爱的搜索引擎。 ]]></description>
			<content:encoded><![CDATA[<p>今天偶亲自去看了下淘宝的Robots文件才相信，淘宝这个上亿级别网页，上亿级别流量的站点，真的屏蔽了百度的爬虫，虽然百度并不一定遵守robots文件协议，目前来看，百度依然收录着淘宝2270万的网页。详见图：
<p style="text-align: center"> <a href="http://www.sunbo.name/index.php/20080907/taobao-pingbi-baidu.html/taobaopingbibaidupachongderobotsjietu/" title="淘宝屏蔽百度爬虫的robots截图" rel="attachment wp-att-1065"><img src="http://www.sunbo.name/wp-content/uploads/2008/09/taobao.jpg" alt="淘宝屏蔽百度爬虫的robots截图" /></a></p>
<p style="text-align: center">淘宝屏蔽百度爬虫的robots截图</p>
<p style="text-align: center"><a href="http://www.sunbo.name/index.php/20080907/taobao-pingbi-baidu.html/baiduduitaobaodeshoulushuliangjietu/" title="百度对淘宝的收录数量截图" rel="attachment wp-att-1066"><img src="http://www.sunbo.name/wp-content/uploads/2008/09/baidu.jpg" alt="百度对淘宝的收录数量截图" /></a></p>
<p style="text-align: center">百度对淘宝的收录数量截图</p>
<p style="text-align: left">由于个人所在的职位，以及个人经历和喜好，我是绝对挺淘宝的，百度是个难以以德服人的公司，尤其在Google这样的竞争对手对比下。淘宝只是个开始吧，诸多网站已经厌倦了百度的惟利是图，当然，不能否认，还是很多愿意趋炎附势追逐利益的。（感觉像小学生在练习用成语，哈）</p>
<p style="text-align: left">有句古话：得人心者得天下&#8230;.做不到公正、客观、不自私的话，不会成为受人喜爱的搜索引擎。 </p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20080907/taobao-pingbi-baidu/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Searchme：换一种方式搜索</title>
		<link>http://www.sunbo.name/20080905/searchme</link>
		<comments>http://www.sunbo.name/20080905/searchme#comments</comments>
		<pubDate>Fri, 05 Sep 2008 10:38:41 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[网络经济]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[搜索引擎优化]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/index.php/20080905/searchme.html</guid>
		<description><![CDATA[各种搜索引擎都试图以特色在市场中抢得一席之地，但总体来说真正能算的上特色的并不多，今天看到Searchme的分析，试用了一下，感觉还是不错的，而且技术上不那么烂，相比一些还没做好就开始叫嚣的SE。 转自：新浪科技 　　长久以来，Google在搜索服务领域的老大地位无人能及，面对枯燥的搜索页面，是不是该换一换了？ 　　曾经投资Google和Yahoo的红杉资本瞄准了另一种新型的搜索模式——可视化搜索，并在近期对该领域中的Searchme进行了第五轮投资，总投资额已达4360万美元，投资机构还包括雷曼兄弟及DAG Ventures等。受到红杉资本的青睐，或多或少也可以看成是未来市场发展方向的一种可能。 　　一谈到搜索，一般人们会想到的就是在搜索框中敲入关键字、按回车键，然后在所有出现的搜索结果中找到一个最好的，这种搜索方式为很多用户提供了很好的服务，也成就了Google的成功，但现在也有一些用户希望搜索能够变得更智能、更有吸引力，甚至是能带来更好的视觉效果。据传，Google也在进行可视化搜索的试验。 　　虽然还不清楚Google的试验是否成功，但目前已经出现了一些抓人眼球的可视化搜索应用，其中比较突出的是Searchme和SpaceTime，与仅仅用一行行的文本来显示搜索结果不同，新的应用将结果用更具视觉效果的形式来展现。SpaceTime用三维视图来显示搜索结果，而Searchme实际上是一个搜索引擎，像扇页一样的形式来展现各搜索结果页面。两个应用的最终目的都是要用户改变现有的搜索方式，用更直观、更可视的方式来选择最符合自己需要的结果，而不再是靠猜测搜索结果里的文本描述来判断哪条结果符合自己的需要。 　　基于网络的搜索引擎Searchme可以工作于Windows和Mac操作系统以及任何主要的浏览器，它允许用户为搜索条目选择一个类别来改善搜索体验。比如在搜索框中输入“美国公开赛”，在搜索框右侧就会显示一个类别列表，包括“网球”、“壁球”、“高尔夫”、“彩票”等，这时用户就可以选择和自己所需要的最相关的类别，进行更精准的搜索，所显示的搜索结果也会更符合用户的需要。 　　Searchme的可视化搜索是通过显示网页快照来实现的，搜索关键字会在每一个页面上突出显示。在这些显示页面的下方会有一个平行卷轴，移动鼠标就可以更换显示页面。而且在页面下方还有一个按钮，显示了与页面相关的文本和链接列表视图。尽管目前Searchme已经可以用可视化的方式索引近10亿网页，但是Searchme的工作人员尚不满足，正在努力使Searchme的搜索能力更加强大、搜索结果更具相关性。 　　目前，Searchme还在测试阶段，至于其未来的商业模式，目前的构想还是广告、文字链或者是在可视化页面中加入图片广告。]]></description>
			<content:encoded><![CDATA[<p><em>各种搜索引擎都试图以特色在市场中抢得一席之地，但总体来说真正能算的上特色的并不多，今天看到<a href="http://www.searchme.com/" title="Searchme">Searchme</a>的分析，试用了一下，感觉还是不错的，而且技术上不那么烂，相比一些还没做好就开始叫嚣的SE。</em> 转自：<a href="http://tech.sina.com.cn/i/2008-09-04/17292436230.shtml">新浪科技</a></p>
<p>　　长久以来，Google在搜索服务领域的老大地位无人能及，面对枯燥的搜索页面，是不是该换一换了？</p>
<p>　　曾经投资Google和Yahoo的红杉资本瞄准了另一种新型的搜索模式——可视化搜索，并在近期对该领域中的Searchme进行了第五轮投资，总投资额已达4360万美元，投资机构还包括雷曼兄弟及DAG Ventures等。受到红杉资本的青睐，或多或少也可以看成是未来市场发展方向的一种可能。</p>
<p>　　一谈到搜索，一般人们会想到的就是在搜索框中敲入关键字、按回车键，然后在所有出现的搜索结果中找到一个最好的，这种搜索方式为很多用户提供了很好的服务，也成就了Google的成功，但现在也有一些用户希望搜索能够变得更智能、更有吸引力，甚至是能带来更好的视觉效果。据传，Google也在进行可视化搜索的试验。</p>
<p>　　虽然还不清楚Google的试验是否成功，但目前已经出现了一些抓人眼球的可视化搜索应用，其中比较突出的是Searchme和SpaceTime，与仅仅用一行行的文本来显示搜索结果不同，新的应用将结果用更具视觉效果的形式来展现。SpaceTime用三维视图来显示搜索结果，而Searchme实际上是一个搜索引擎，像扇页一样的形式来展现各搜索结果页面。两个应用的最终目的都是要用户改变现有的搜索方式，用更直观、更可视的方式来选择最符合自己需要的结果，而不再是靠猜测搜索结果里的文本描述来判断哪条结果符合自己的需要。</p>
<p>　　基于网络的搜索引擎Searchme可以工作于Windows和Mac操作系统以及任何主要的浏览器，它允许用户为搜索条目选择一个类别来改善搜索体验。比如在搜索框中输入“美国公开赛”，在搜索框右侧就会显示一个类别列表，包括“网球”、“壁球”、“高尔夫”、“彩票”等，这时用户就可以选择和自己所需要的最相关的类别，进行更精准的搜索，所显示的搜索结果也会更符合用户的需要。</p>
<p>　　Searchme的可视化搜索是通过显示网页快照来实现的，搜索关键字会在每一个页面上突出显示。在这些显示页面的下方会有一个平行卷轴，移动鼠标就可以更换显示页面。而且在页面下方还有一个按钮，显示了与页面相关的文本和链接列表视图。尽管目前Searchme已经可以用可视化的方式索引近10亿网页，但是Searchme的工作人员尚不满足，正在努力使Searchme的搜索能力更加强大、搜索结果更具相关性。</p>
<p>　　目前，Searchme还在测试阶段，至于其未来的商业模式，目前的构想还是广告、文字链或者是在可视化页面中加入图片广告。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20080905/searchme/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>404错误页面对SEO的影响</title>
		<link>http://www.sunbo.name/20080424/404-error</link>
		<comments>http://www.sunbo.name/20080424/404-error#comments</comments>
		<pubDate>Thu, 24 Apr 2008 03:15:26 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[apache设置]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/index.php/20080424/404-error.html</guid>
		<description><![CDATA[今天在404的apache设置以及正确返回状态码的问题上产生了意见分歧，发生了小争执，于是我再次搜一下找到了这篇文章看一下，希望大家以后遇到时注意这个问题，不要顾及用户体验时忽略了对搜索引擎的影响。这篇文章来自：黑色梦中的SEO博客，他对这个问题的研究比较深。 Http状态码： 404：服务器找不到指定的资源，请求的网页不存在(譬如浏览器请求的网页被删除或者移位，但不排除日后该链接有效的可能性)； 410：请求的网页不存在(注意：410表示永久性，而404表示临时性)； 200：服务器成功返回请求的网页； 301：网址永久性重定向 302：网址临时性重定向 注意：大部分搜索引擎将“404”与“410”状态同等对待，如Google。 对HTTP404状态码的理解 　　HTTP 404 错误意味着链接指向的网页不存在，即原始网页的URL失效，这种情况经常会发生，很难避免，比如说：网页URL生成规则改变、网页文件更名或移动位置、导入链接拼写错误等，导致原来的URL地址无法访问；当Web 服务器接到类似请求时，会返回一个404 状态码，告诉浏览器要请求的资源并不存在。但是，Web服务器默认的404错误页面，无论Apache还是IIS，均十分简陋、呆板且对用户不友好，无法给用户提供必要的信息以获取更多线索，无疑这会造成用户的流失。 　　因此，很多网站均使用自定义404错误的方式以提供用户体验避免用户流失。一般而言，自定义404页面通用的做法是在页面中放置网站快速导航链接、搜索框以及网站提供的特色服务，这样可以有效的帮助用户访问站点并获取需要的信息。 HTTP404对SEO的影响 　　自定义404错误页面是提供用户体验的很好的做法，但在应用过程中往往并未注意到对搜索引擎的影响，譬如：错误的服务器端配置导致返回“200”状态码或自定义404错误页面使用Meta Refresh导致返回“302”状态码。正确设置的自定义404错误页面，不仅应当能够正确地显示，同时，应该返回“404”错误代码，而不是“200”或“302”。虽然对访问的用户而言，HTTP状态码究竟是“404”还是“200”来说并没有什么区别，但对搜索引擎而言，这则是相当重要的。 (一)自定义404错误页返回“200”状态码 　　当搜索引擎蜘蛛在请求某个URL时得到“404”状态回应时，即知道该URL已经失效，便不再索引该网页，并向数据中心反馈将该URL表示的网页从索引数据库中删除，当然，删除过程有可能需要很长时间；而当搜索引擎得到“200”状态回应时，则会认为该url是有效的，便会去索引，并会将其收录到索引数据库，这样的结果便是这两个不同的url具有完全相同的内容：自定义404错误页面的内容，这会导致出现复制网页问题。对搜索引擎而言，特别是Google，不但很难获得信任指数TrustRank，也会大大降低Google对网站质量的评定。（为什么会出现返回“200”状态码的情况？？请参看下面内容“自定义404错误页面的基本原则”） 　　我一直在使用Google Sitemap，当我们提交XML格式网站地图文件时，Google会验证我们的身份以确保是网站合法的管理者。验证方式有两种：上传指定名称的html页到网站根目录或者在网页meta区域添加一个标识身份的meta标签。我通常是使用上传html网页的方式，但Google却提示我网站根目录下找不到这个网页（实际上我已上传，并且通过浏览器可以访问），这是一个很可怕的问题，见图： (二)自定义404错误页使用Meta Refresh返回“302”状态码 　　常常看到许多网站的自定义404错误页面采取类似这样的形式：首先显示一段错误信息，然后，通过Meta Refresh将页面跳转到网站首页、网页地图或其他类似页。根据具体实现方式不同，这类404页面可能返回“200”状态码，也可能返回“302”，但不论哪种，从SEO技术角度看，均不是一种合适的选择。 　　对“200”状态的情况我们上面已经谈过，那么，当404页面返回“302”时，搜索引擎会怎么对待呢？从理论上说，对“302”错误，搜索引擎认为该网页是存在的，只不过临时改变了地址，仍然会索引收录该页，这样，同样会出现类似于“200”状态码时的重复文本问题；其次，以google为代表的主流搜索引擎对302重定向的适用范围要求越来越严格，这类不当使用302重定向的情况存在很大的风险。 确保自定义404错误页面能够返回“404”状态码 　　在自定义404错误页面设置完毕后，一定要检查一下其是不是能够正确地返回“404”状态码。可以使用Server Header检查工具，输入一个不存在网页的url，查看一下HTTP Header的返回情况，确信其返回的是“404 Not found”。 404错误的处理方式 (一)定制404错误页面的基本原则 　　首先应明确的是，404错误应工作在服务器级而不是网页级。对定制使用动态页面如PHP脚本类型的404页时，必须确保在PHP执行前服务器已经顺利地送出“404”状态码，不然，一旦执行到了ISAPI级别，返回的状态码便只能是“200”或其他如“302”之类的重定向状态码了。 　　其次，在自定义网站的404错误页面时，对设置的错误页面URL链接应使用相对路径而不是绝对路径，而且自定义404页面应该放在网站根目录下。尽管无效链接可能是多种形式的URL，但当发生404访问错误时，WEB服务器会自动将其转到自定义的当404错误页中，这跟URL的形似没有关系。 (二)Apache下设置404错误页面 　　为Apache Server设置 404错误页面的方法很简单，只需在.htaccess 文件中加入如下内容即可： ErrorDocument 404 /notfound.php 注意： 1.切记不要将404错误转向到网站主页，否则可能会导致主页在搜索引擎中消失 2.切记不要使用绝对URL(例如：http://www.bloghuman.com/nofound.php形式)，如果使用绝对URL返回的状态码是“302”+“200”（已测试） (三)IIS/ASP.net下设置404错误页面 首先，修改应用程序根目录的设置，打开 “web.config” 文件编辑，在其中加入如下内容： ＜configuration＞ ＜system.web＞ ＜customErrors [...]]]></description>
			<content:encoded><![CDATA[<p>今天在404的apache设置以及正确返回状态码的问题上产生了意见分歧，发生了小争执，于是我再次搜一下找到了这篇文章看一下，希望大家以后遇到时注意这个问题，不要顾及用户体验时忽略了对搜索引擎的影响。这篇文章来自：<a href="http://www.bloghuman.com/post/227/">黑色梦中的SEO博客</a>，他对这个问题的研究比较深。<span id="more-908"></span></p>
<p>Http状态码：<br />
404：服务器找不到指定的资源，请求的网页不存在(譬如浏览器请求的网页被删除或者移位，但不排除日后该链接有效的可能性)；<br />
410：请求的网页不存在(注意：410表示永久性，而404表示临时性)；<br />
200：服务器成功返回请求的网页；<br />
301：网址永久性重定向<br />
302：网址临时性重定向</p>
<p>注意：大部分搜索引擎将“404”与“410”状态同等对待，如Google。</p>
<p><span style="font-size: 14px"><strong>对HTTP404状态码的理解</strong></span></p>
<p>　　HTTP 404 错误意味着链接指向的网页不存在，即原始网页的URL失效，这种情况经常会发生，很难避免，比如说：网页URL生成规则改变、网页文件更名或移动位置、导入链接拼写错误等，导致原来的URL地址无法访问；当Web 服务器接到类似请求时，会返回一个404 状态码，告诉浏览器要请求的资源并不存在。但是，Web服务器默认的404错误页面，无论Apache还是IIS，均十分简陋、呆板且对用户不友好，无法给用户提供必要的信息以获取更多线索，无疑这会造成用户的流失。</p>
<p>　　因此，很多网站均使用自定义404错误的方式以提供用户体验避免用户流失。一般而言，自定义404页面通用的做法是在页面中放置网站快速导航链接、搜索框以及网站提供的特色服务，这样可以有效的帮助用户访问站点并获取需要的信息。</p>
<p><span style="font-size: 14px"><strong>HTTP404对SEO的影响</strong></span></p>
<p>　　自定义404错误页面是提供用户体验的很好的做法，但在应用过程中往往并未注意到对搜索引擎的影响，譬如：错误的服务器端配置导致返回“200”状态码或自定义404错误页面使用Meta Refresh导致返回“302”状态码。正确设置的自定义404错误页面，不仅应当能够正确地显示，同时，应该返回“404”错误代码，而不是“200”或“302”。虽然对访问的用户而言，HTTP状态码究竟是“404”还是“200”来说并没有什么区别，但对搜索引擎而言，这则是相当重要的。</p>
<p><span style="font-size: 12px"><strong>(一)自定义404错误页返回“200”状态码</strong></span></p>
<p>　　当搜索引擎蜘蛛在请求某个URL时得到“404”状态回应时，即知道该URL已经失效，便不再索引该网页，并向数据中心反馈将该URL表示的网页从索引数据库中删除，当然，删除过程有可能需要很长时间；而当搜索引擎得到“200”状态回应时，则会认为该url是有效的，便会去索引，并会将其收录到索引数据库，这样的结果便是这两个不同的url具有完全相同的内容：自定义404错误页面的内容，这会导致出现复制网页问题。对搜索引擎而言，特别是Google，不但很难获得信任指数TrustRank，也会大大降低Google对网站质量的评定。（为什么会出现返回“200”状态码的情况？？请参看下面内容“自定义404错误页面的基本原则”）</p>
<p>　　我一直在使用Google Sitemap，当我们提交XML格式网站地图文件时，Google会验证我们的身份以确保是网站合法的管理者。验证方式有两种：上传指定名称的html页到网站根目录或者在网页meta区域添加一个标识身份的meta标签。我通常是使用上传html网页的方式，但Google却提示我网站根目录下找不到这个网页（实际上我已上传，并且通过浏览器可以访问），这是一个很可怕的问题，见图：</p>
<p><a href="http://www.sunbo.name/wp-content/uploads/2008/04/http-statuscode-404-and-200.gif" title="http-statuscode-404-and-200"><img src="http://www.sunbo.name/wp-content/uploads/2008/04/http-statuscode-404-and-200.gif" alt="http-statuscode-404-and-200" /></a></p>
<p><span style="font-size: 12px"><strong>(二)自定义404错误页使用Meta Refresh返回“302”状态码</strong></span></p>
<p>　　常常看到许多网站的自定义404错误页面采取类似这样的形式：首先显示一段错误信息，然后，通过Meta Refresh将页面跳转到网站首页、网页地图或其他类似页。根据具体实现方式不同，这类404页面可能返回“200”状态码，也可能返回“302”，但不论哪种，从SEO技术角度看，均不是一种合适的选择。</p>
<p>　　对“200”状态的情况我们上面已经谈过，那么，当404页面返回“302”时，搜索引擎会怎么对待呢？从理论上说，对“302”错误，搜索引擎认为该网页是存在的，只不过临时改变了地址，仍然会索引收录该页，这样，同样会出现类似于“200”状态码时的重复文本问题；其次，以google为代表的主流搜索引擎对302重定向的适用范围要求越来越严格，这类不当使用302重定向的情况存在很大的风险。</p>
<p><span style="font-size: 14px"><strong>确保自定义404错误页面能够返回“404”状态码</strong></span></p>
<p>　　在自定义404错误页面设置完毕后，一定要检查一下其是不是能够正确地返回“404”状态码。可以使用Server Header检查工具，输入一个不存在网页的url，查看一下HTTP Header的返回情况，确信其返回的是“404 Not found”。</p>
<p><span style="font-size: 14px"><strong>404错误的处理方式</strong></span><br />
<span style="font-size: 12px"><strong>(一)定制404错误页面的基本原则</strong></span></p>
<p>　　<strong>首先应明确的是，404错误应工作在服务器级而不是网页级</strong>。对定制使用动态页面如PHP脚本类型的404页时，必须确保在PHP执行前服务器已经顺利地送出“404”状态码，不然，一旦执行到了ISAPI级别，返回的状态码便只能是“200”或其他如“302”之类的重定向状态码了。</p>
<p>　　<strong>其次，在自定义网站的404错误页面时，对设置的错误页面URL链接应使用相对路径而不是绝对路径，而且自定义404页面应该放在网站根目录下</strong>。尽管无效链接可能是多种形式的URL，但当发生404访问错误时，WEB服务器会自动将其转到自定义的当404错误页中，这跟URL的形似没有关系。<img border="0" src="http://www.bloghuman.com/images/emot/smile.gif" alt="smile" /></p>
<p><span style="font-size: 12px"><strong>(二)Apache下设置404错误页面</strong></span></p>
<p>　　为Apache Server设置 404错误页面的方法很简单，只需在.htaccess 文件中加入如下内容即可：</p>
<p class="code">ErrorDocument 404 /notfound.php</p>
<p><span style="color: #ff0000">注意：<br />
1.切记不要将404错误转向到网站主页，否则可能会导致主页在搜索引擎中消失<br />
2.切记不要使用绝对URL(例如：http://www.bloghuman.com/nofound.php形式)，如果使用绝对URL返回的状态码是“302”+“200”（已测试）<br />
</span></p>
<p><span style="font-size: 12px"><strong>(三)IIS/ASP.net下设置404错误页面</strong></span></p>
<p>首先，修改应用程序根目录的设置，打开 “web.config” 文件编辑，在其中加入如下内容：</p>
<p class="code">＜configuration＞<br />
＜system.web＞<br />
＜customErrors mode=”On” defaultRedirect=”error.asp”＞<br />
＜error statusCode=”404″ redirect=”notfound.asp” /＞<br />
＜/customErrors＞<br />
＜/system.web＞<br />
＜/configuration＞</p>
<p>注：上文例中“error.asp”为系统默认的404页面，“notfound.asp”为自定义的404页面，使用时请修改相应文件名。</p>
<p>然后，在自定义的404页面“notfound.asp”中加入：</p>
<p class="code">＜%<br />
Response.Status = “404 Not Found”<br />
%＞</p>
<p>这样，便可以保证IIS能够正确地返回“404”状态码</p>
<p><span style="font-size: 12px"><strong>(四)在IIS/ASP.net下设置404静态页面</strong></span></p>
<p>设置静态404错误页面的方法则比较简单，在IIS管理器中右键单击要管理的网站，打开“属性”中的“自定义错误信息”页，为“404”设定相应的错误信息页即可。不过，此处在“消息类型”中一定要选择“文件”或“默认值”，而不要选择“URL”，不然，将导致返回“200”状态码。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20080424/404-error/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>记2008厦门搜索引擎营销SEM大会</title>
		<link>http://www.sunbo.name/20080421/2008-xiamen-sem</link>
		<comments>http://www.sunbo.name/20080421/2008-xiamen-sem#comments</comments>
		<pubDate>Mon, 21 Apr 2008 09:56:53 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[网络经济]]></category>
		<category><![CDATA[阿里巴巴]]></category>
		<category><![CDATA[会议]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/index.php/20080421/2008-xiamen-sem.html</guid>
		<description><![CDATA[这是我第二次来到厦门参加SEM大会，这次的感受已经事先预料到的平淡。大会办的规模和质量，都不如上一届。除了阿里巴巴核心产品部的经理吴初明，嘉宾们讲的内容几乎都是重复的。 这届大会在我这个入门较早的人来看，证实了一个观点。就是真正的牛人是不走穴的，而且真正独到的见解一般不会拿出来讲的。 点石互动的两位仁兄在这次大会上的表现很折面子，分别被两位人士质疑和挑战的无话可说。确实，他们在讲的，有些陈腔滥调，而且，他们对所有人都用入门的原则的东西讲，显然是不明智的，尤其是对一些大佬来说(比如我的师傅)。]]></description>
			<content:encoded><![CDATA[<p align="left">这是我第二次来到厦门参加SEM大会，这次的感受已经事先预料到的平淡。大会办的规模和质量，都不如上一届。除了阿里巴巴核心产品部的经理吴初明，嘉宾们讲的内容几乎都是重复的。<br />
这届大会在我这个入门较早的人来看，证实了一个观点。就是真正的牛人是不走穴的，而且真正独到的见解一般不会拿出来讲的。<br />
点石互动的两位仁兄在这次大会上的表现很折面子，分别被两位人士质疑和挑战的无话可说。确实，他们在讲的，有些陈腔滥调，而且，他们对所有人都用入门的原则的东西讲，显然是不明智的，尤其是对一些大佬来说(比如我的师傅)。<br />
<a rel="attachment wp-att-890" href="http://www.sunbo.name/index.php/20080421/2008-xiamen-sem.html/2008xiamensousuoyinqingyingxiaosemdahuitupian/" title="2008厦门搜索引擎营销SEM大会图片"></p>
<p style="text-align: center"><img src="http://www.sunbo.name/wp-content/uploads/2008/04/sem3.jpg" alt="2008厦门搜索引擎营销SEM大会图片" /></p>
<p></a></p>
<p align="center"><a rel="attachment wp-att-891" href="http://www.sunbo.name/index.php/20080421/2008-xiamen-sem.html/xiamensousuoyinqingyingxiaosemdahuizhaopian/" title="厦门搜索引擎营销SEM大会照片"><img src="http://www.sunbo.name/wp-content/uploads/2008/04/meeting.jpg" alt="厦门搜索引擎营销SEM大会照片" /></a></p>
<p align="center"><a rel="attachment wp-att-892" href="http://www.sunbo.name/index.php/20080421/2008-xiamen-sem.html/2008xiamensemdahuizhaopian/" title="2008厦门SEM大会照片"><img src="http://www.sunbo.name/wp-content/uploads/2008/04/sem.jpg" alt="2008厦门SEM大会照片" /></a></p>
<p align="center"><a rel="attachment wp-att-893" href="http://www.sunbo.name/index.php/20080421/2008-xiamen-sem.html/xiamensemdahuiliuying/" title="厦门SEM大会留影"><img src="http://www.sunbo.name/wp-content/uploads/2008/04/meeting2.jpg" alt="厦门SEM大会留影" /></a></p>
<p align="center"><a rel="attachment wp-att-895" href="http://www.sunbo.name/index.php/20080421/2008-xiamen-sem.html/canjiaxiamensemdahuiwithliushuai/" title="参加厦门SEM大会 with 刘帅"><img src="http://www.sunbo.name/wp-content/uploads/2008/04/sem22.jpg" alt="参加厦门SEM大会 with 刘帅" /></a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20080421/2008-xiamen-sem/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>小心！Google在随时随刻盯着你！</title>
		<link>http://www.sunbo.name/20080326/google-stare-at-you</link>
		<comments>http://www.sunbo.name/20080326/google-stare-at-you#comments</comments>
		<pubDate>Wed, 26 Mar 2008 14:30:53 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[网络经济]]></category>
		<category><![CDATA[网站]]></category>
		<category><![CDATA[google]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/index.php/20080326/google-stare-at-you.html</guid>
		<description><![CDATA[我不是在危言耸听，今天我决定测试一下Google的更新问题，结果让我非常吃惊。 近期我一些零星的观察让我想专门测试一下Google更新速率的问题。我以前的习惯是每天最多1-2篇新的Blog文章，每次发完，隔十几分钟或二十几分钟去看一下搜索引擎的反应，总发现Google的索引中已经更新了我首页的描述为新发的文章的文字部分(我的首页没有设置固定的Meta Description)，而且大部分时候，该篇文章的单页也被收录了。我赞叹Google的更新速率，也在想，可能Google是恰巧在更新我的站点吧。 今天晚上我做了下简单的测试，我连续发了三篇文章，每发完一篇，我就等一段时间看Google的索引是否有变化，实际上，每次都是文章发出后10分钟内就被收录了，而且首页的描述部分已经更新！  作为一个小Blog的站长，我在同一个晚上，3个小时内，发的三篇文章，均在几分钟内，被Google的爬虫爬过并将该页出现在搜索索引记录中。站在我们这样一个地球上亿万分个站点中的一个Blog小站的角度，仰起头来看一下Google对于站点的爬取技术和更新速率，我感到可怖。当然，这次测试并不能说明Google的整体更新节奏，也许也是恰逢较活跃的更新周期。  另外，在收录新页面后，短时间内同一个Keywords搜索结果中该页面的排名会不断更新，我测试的两个页面在对应的Keywords的搜索结果中，一个词收录后半小时内从第二到第一，一个词在半小时内从第八到了第七。这说明Google在收录后也是在评估和计算该页面的权重和内容质量，来调整页面排序。 其中有两次我截了图，如下： 这是我在文章发出10几分钟后查的首页更新情况 同时测试了单页的收录，&#8221;百度Hi使用测评&#8221;页面已经出现在首页的排名中。 这次更新也出现在发布了10几分钟的时候 新页的收录要比首页的更新晚一些]]></description>
			<content:encoded><![CDATA[<p><a rel="attachment wp-att-848" href="http://www.sunbo.name/index.php/20080326/google-stare-at-you.html/googleshoulujietu3/" title="Google收录截图3"></a></p>
<p><a rel="attachment wp-att-846" href="http://www.sunbo.name/index.php/20080326/google-stare-at-you.html/googlegengxinjietu1/" title="Google更新截图1"></a>我不是在危言耸听，今天我决定测试一下Google的更新问题，结果让我非常吃惊。</p>
<p>近期我一些零星的观察让我想专门测试一下Google更新速率的问题。我以前的习惯是每天最多1-2篇新的Blog文章，每次发完，隔十几分钟或二十几分钟去看一下搜索引擎的反应，总发现Google的索引中已经更新了我首页的描述为新发的文章的文字部分(我的首页没有设置固定的Meta Description)，而且大部分时候，该篇文章的单页也被收录了。我赞叹Google的更新速率，也在想，可能Google是恰巧在更新我的站点吧。</p>
<p>今天晚上我做了下简单的测试，我连续发了三篇文章，每发完一篇，我就等一段时间看Google的索引是否有变化，实际上，每次都是文章发出后10分钟内就被收录了，而且首页的描述部分已经更新！</p>
<p> 作为一个小Blog的站长，我在同一个晚上，3个小时内，发的三篇文章，均在几分钟内，被Google的爬虫爬过并将该页出现在搜索索引记录中。站在我们这样一个地球上亿万分个站点中的一个Blog小站的角度，仰起头来看一下Google对于站点的爬取技术和更新速率，我感到可怖。当然，这次测试并不能说明Google的整体更新节奏，也许也是恰逢较活跃的更新周期。</p>
<p> 另外，在收录新页面后，短时间内同一个Keywords搜索结果中该页面的排名会不断更新，我测试的两个页面在对应的Keywords的搜索结果中，一个词收录后半小时内从第二到第一，一个词在半小时内从第八到了第七。这说明Google在收录后也是在评估和计算该页面的权重和内容质量，来调整页面排序。</p>
<p>其中有两次我截了图，如下：</p>
<p align="center"><a rel="attachment wp-att-843" href="http://www.sunbo.name/index.php/20080326/google-stare-at-you.html/googleshoulusulvjietu1/" title="Google收录速率截图1"></a><a rel="attachment wp-att-846" href="http://www.sunbo.name/index.php/20080326/google-stare-at-you.html/googlegengxinjietu1/" title="Google更新截图1"><img src="http://www.sunbo.name/wp-content/uploads/2008/03/google-image.jpg" alt="Google更新截图1" /></a><a rel="attachment wp-att-847" href="http://www.sunbo.name/index.php/20080326/google-stare-at-you.html/googleshoulujietu2/" title="Google收录截图2"></a><br />
<strong>这是我在文章发出10几分钟后查的首页更新情况<br />
</strong></p>
<p align="center"><strong><a rel="attachment wp-att-847" href="http://www.sunbo.name/index.php/20080326/google-stare-at-you.html/googleshoulujietu2/" title="Google收录截图2"><img src="http://www.sunbo.name/wp-content/uploads/2008/03/google-image2.jpg" alt="Google收录截图2" /></a></strong><br />
<strong>同时测试了单页的收录，&#8221;百度Hi使用测评&#8221;页面已经出现在首页的排名中</strong>。</p>
<p align="center"><a rel="attachment wp-att-848" href="http://www.sunbo.name/index.php/20080326/google-stare-at-you.html/googleshoulujietu3/" title="Google收录截图3"><img src="http://www.sunbo.name/wp-content/uploads/2008/03/google-image3.jpg" alt="Google收录截图3" /></a><br />
<strong>这次更新也出现在发布了10几分钟的时候</strong></p>
<p align="center"><a rel="attachment wp-att-849" href="http://www.sunbo.name/index.php/20080326/google-stare-at-you.html/googlegengxinjietu4/" title="Google更新截图4"><img src="http://www.sunbo.name/wp-content/uploads/2008/03/google-image4.jpg" alt="Google更新截图4" /></a><br />
<strong>新页的收录要比首页的更新晚一些</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20080326/google-stare-at-you/feed</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>Html语义化标签-语义化你的HTML标签和属性</title>
		<link>http://www.sunbo.name/20080219/yuyihua-biaoqian</link>
		<comments>http://www.sunbo.name/20080219/yuyihua-biaoqian#comments</comments>
		<pubDate>Tue, 19 Feb 2008 09:56:48 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[搜索引擎优化]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html</guid>
		<description><![CDATA[1 语义化你的HTML标签和属性 1.1 &#60;Hx&#62; 1.2 &#60;p&#62; 1.3 &#60;ul&#62;、&#60;ol&#62;、&#60;li&#62; 1.4 &#60;dl&#62;、&#60;dt&#62;、&#60;dd&#62; 1.5 &#60;cite&#62;、cite 、&#60;q&#62;、 &#60;blockquote&#62; 1.6 &#60;em&#62;、 &#60;strong&#62; 1.7 &#60;table&#62;、&#60;td&#62;、&#60;th&#62;、&#60; caption &#62;、 summary 1.8 &#60;dfn&#62; 1.9 &#60;ins&#62;, &#60;del&#62; 1.10 &#60;code&#62; 1.11 &#60;abbr&#62;、&#60;acronym&#62; 1.12 alt属性和title属性 分离结构与表现的另一个重要方面是使用语义化的标记来构造文档内容。一个 XHTML 元素的存在就意味被标记内容的那部分有相应的结构化的意义，没有理由使用其他的标记。换句话说，不要让 CSS 使一个 HTML 元素看起来就像另一个 HTML 元素，比如用&#60;div&#62;来代替&#60;p&#62;标记标题。 首先是关于语义（Semantics）和默认样式的区别，默认样式是浏览器设定的一些常用tag的表现形式，个人认为他的主要目的就是让大家直观的认识标签(markup)和属性(attribute)的用途和作用，很明显Hx系列看起来很像标题，因为拥有粗体和较大的字号。&#60;strong&#62;,&#60;em&#62;用来区别于其他文字，起到了强调的作用。至于列表和表格很明显的告诉你他们是做什么的。 其次，语义化的网页的好处，最主要的就是对搜索引擎友好，又了良好的结构和语义你的网页内容自然容易被搜索引擎抓取，你网站的推广便可以省下不少的功夫。 具体的语义和用途在，XHTML1.0 TAG 参考中都已经说明，这里将一些容易遗忘或者混淆的TAGS和属性予以补充。 &#60;Hx&#62; &#60;h1&#62;、&#60;h2&#62;、&#60;h3&#62;、&#60;h4&#62;、&#60;h5&#62;、&#60;h6&#62;,作为标题使用，并且依据重要性递减。&#60;h1&#62;是最高的等级。 例如: &#60;h1&#62;文档标题&#60;/h1&#62; &#60;h2&#62;次级标题&#60;/h2&#62; 而不要使用 &#60;div class=&#8221;title&#8221;&#62;文档标题&#60;/div&#62;，或者&#60;span [...]]]></description>
			<content:encoded><![CDATA[<ul>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001"><font color="#1e90ff">1 语义化你的HTML标签和属性</font></a>
<ul>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001001"><font color="#1e90ff">1.1 <strong>&lt;Hx&gt;</strong><br />
</font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001002"><font color="#1e90ff">1.2 <strong>&lt;p&gt;</strong><br />
</font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001003"><font color="#1e90ff">1.3 <strong>&lt;ul&gt;、&lt;ol&gt;、&lt;li&gt;</strong></font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001004"><font color="#1e90ff">1.4 <strong>&lt;dl&gt;、&lt;dt&gt;、&lt;dd&gt;</strong></font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001005"><font color="#1e90ff">1.5 <strong>&lt;cite&gt;、cite 、&lt;q&gt;、 &lt;blockquote&gt;</strong><br />
</font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001006"><font color="#1e90ff">1.6 <strong>&lt;em&gt;、 &lt;strong&gt;</strong><br />
</font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001007"><font color="#1e90ff">1.7 <strong>&lt;table&gt;、&lt;td&gt;、&lt;th&gt;、&lt; caption &gt;、 summary</strong></font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001008"><font color="#1e90ff">1.8 <strong>&lt;dfn&gt;</strong><br />
</font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001009"><font color="#1e90ff">1.9 <strong>&lt;ins&gt;, &lt;del&gt;</strong></font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001010"><font color="#1e90ff">1.10 <strong>&lt;code&gt;</strong><br />
</font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001011"><font color="#1e90ff">1.11 <strong>&lt;abbr&gt;、&lt;acronym&gt;</strong><br />
</font></a></li>
<li class="toc"><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001012"><font color="#1e90ff">1.12 <strong>alt属性和title属性</strong></font></a><a href="http://www.sunbo.name/index.php/20080219/yuyihua-biaoqian.html#hd001013"><br />
</a><span id="more-777"></span></li>
</ul>
</li>
</ul>
<p>分离结构与表现的另一个重要方面是使用语义化的标记来构造文档内容。一个 XHTML 元素的存在就意味被标记内容的那部分有相应的结构化的意义，没有理由使用其他的标记。换句话说，不要让 CSS 使一个 HTML 元素看起来就像另一个 HTML 元素，比如用&lt;div&gt;来代替&lt;p&gt;标记标题。</p>
<p>首先是关于语义（Semantics）和默认样式的区别，默认样式是浏览器设定的一些常用tag的表现形式，个人认为他的主要目的就是让大家直观的认识标签(markup)和属性(attribute)的用途和作用，很明显Hx系列看起来很像标题，因为拥有粗体和较大的字号。&lt;strong&gt;,&lt;em&gt;用来区别于其他文字，起到了强调的作用。至于列表和表格很明显的告诉你他们是做什么的。</p>
<p>其次，语义化的网页的好处，最主要的就是对搜索引擎友好，又了良好的结构和语义你的网页内容自然容易被搜索引擎抓取，你网站的推广便可以省下不少的功夫。</p>
<p>具体的语义和用途在，<a target="_blank" href="http://www.jluvip.com/blog/article.asp?id=250"><font color="#1e90ff">XHTML1.0 TAG </font></a>参考中都已经说明，这里将一些容易遗忘或者混淆的TAGS和属性予以补充。</p>
<h2><a name="hd001001" title="hd001001"></a><strong>&lt;Hx&gt;</strong></h2>
<p>&lt;h1&gt;、&lt;h2&gt;、&lt;h3&gt;、&lt;h4&gt;、&lt;h5&gt;、&lt;h6&gt;,作为标题使用，并且依据重要性递减。&lt;h1&gt;是最高的等级。<br />
例如:</p>
<p><code>&lt;h1&gt;文档标题&lt;/h1&gt;<br />
&lt;h2&gt;次级标题&lt;/h2&gt;</code></p>
<p>而不要使用<br />
&lt;div class=&#8221;title&#8221;&gt;文档标题&lt;/div&gt;，或者&lt;span class=&#8221;title&#8221;&gt;文档标题&lt;/span&gt;.很明显搜索引擎对于后者是不会认为他是标题的。</p>
<h2><a name="hd001002" title="hd001002"></a><strong>&lt;p&gt;</strong></h2>
<p>段落标记，知道了&lt;p&gt;作为段落，你就不会再使用&lt;br/&gt;来换行了，而且不需要&lt;br/&gt;&lt;br/&gt;来区分段落与段落。&lt;p&gt;&lt;/p&gt;中的文字会自动换行，而且换行的效果优于&lt;br&gt;。段落与段落之间的空隙也可以利用CSS来控制，很容易而且清晰的区分出段落与段落。在利用行高(line-height)很容易的定义出行间距，再定义首字下沉等效果，那就挺完美了。<br />
例如：</p>
<p><code>&lt;p&gt;蓝色理想 www.blueidea.com 诞生于1999年的10月。从成立之初，蓝色理想就以建设网站设计与开发人员之家为宗旨，以介绍网络开发技术与网站创作设计交流为主要内容。其网站内容制作精良，每天都会有会员精心制作的教程发布，无私地对网友进行帮助，而且还举办过不少设计比赛并开发了很多目前仍被许多网站应用的相关程序。而所发布的作品与点评受到了多家媒体关注及行家的好评，同时也从中确立了自己的社会地位，于是一批又一批的网络同仁加盟了蓝色理想，成为国内最大的设计类站点之一。<br />
&lt;/p&gt;<br />
&lt;p&gt;多年来，蓝色理想的内容不断充实，先后被国内一些知名网站、传统媒体重点推介过，并陆续被Google、百度、雅虎、搜狐、新浪、Excite等各大搜索站点收藏，并在Google、百度、Yahoo三大搜索引擎中以简体汉字关键词"网站设计与开发”搜索排名均为第一，现在蓝色理想已发展成为国内影响最大的网站设计、开发的专业网站之一。&lt;/p&gt;度)</code></p>
<h2><a name="hd001003" title="hd001003"></a><strong>&lt;ul&gt;、&lt;ol&gt;、&lt;li&gt;</strong></h2>
<p>&lt;ul&gt;无序列表，很常见的到了大家广泛的使用，&lt;ol&gt;有序列表也挺常用。在web标准化过程中，&lt;ul&gt;还被更多的用于导航条，本来导航条就是个列表，这样做是完全正确的，而且当你的浏览器不支持CSS的时候，导航链接仍然很好使，就是美观方面差了一点。<br />
例如:</p>
<p><code>&lt;ul&gt;<br />
　&lt;li&gt;项目一&lt;/li&gt;<br />
　&lt;li&gt;项目二&lt;/li&gt;<br />
　&lt;li&gt;项目三&lt;/li&gt;<br />
&lt;/ul&gt;</code> <code>&lt;ol&gt;<br />
　&lt;li&gt;第一章&lt;/li&gt;<br />
　&lt;li&gt;第二章&lt;/li&gt;<br />
　&lt;li&gt;第三章&lt;/li&gt;<br />
&lt;/ol&gt;</code></p>
<h2><a name="hd001004" title="hd001004"></a><strong>&lt;dl&gt;、&lt;dt&gt;、&lt;dd&gt;</strong></h2>
<p>dl就是“定义列表”。比如说词典里面的词的解释、定义就可以用这种列表。<br />
例如：</p>
<p><code>&lt;dl&gt;<br />
&lt;dt&gt;Dog&lt;/dt&gt;<br />
&lt;dd&gt;A carnivorous mammal of the family Canidae.&lt;/dd&gt;<br />
&lt;/dl&gt;</code><br />
<code>&lt;dl&gt;<br />
　&lt;dt&gt;上海滩&lt;/dt&gt;<br />
　&lt;dd&gt;这部拍摄于1980年的《上海滩》堪称是香港电视史上最成功、最经典的剧集。<br />
　当年在香港播出以后，产生了巨大的轰动效应。&lt;/dd&gt;<br />
　&lt;dt&gt;周润发&lt;/dt&gt;<br />
　&lt;dd&gt;和所有伟大的影星一样，周润发印证了一个时代，一个香港电影的黄金时代。<br />
风衣墨镜、冷血双枪、阳光微笑，都封存胶片之中，当我们回首寻望的时候，发哥已被刻为一个时代的坐标。&lt;/dd&gt;<br />
&lt;/dl&gt; 0;</code></p>
<h2><a name="hd001005" title="hd001005"></a><strong>&lt;cite&gt;、cite 、&lt;q&gt;、 &lt;blockquote&gt;</strong></h2>
<p>论坛和blog经常会用到引用别人的话，用&lt;q&gt;来标记简短的单行引用。Web浏览器会自动识别在&lt;q&gt; 之间的内容。不幸的是，IE不能识别，并且有些时候， &lt;q&gt;会引起一些可访问性(Accessibility)的问题。正因为如此，一些人建议尽量不要使用 &lt;q&gt;,手动的插入引用标记。在一个包含适当的类的 &lt;span&gt;中加入单行的引用内容，那么就可以用CSS来给引用设计样式了，但是这个没有语义上的意义。 您可以读读Mark Pilgrim写的The Q tag??(http://diveintomark.org/archives/2002/05/04/the_q_tag )关于处理&lt;q&gt;相关问题的看法。</p>
<p>对于那些一段或者好几段的长篇引用，就应当使用 &lt;blockquote&gt;了。CSS可以用来定义引用的样式。注意，一段文章是不可以直接放在&lt;blockquote&gt;中的，引用的内容还必须包含在一个元素中，通常是&lt;p&gt;。属性cite既可以与&lt;q&gt; 一起用，也可以与&lt;blockquote&gt;一起用，用来提供引用内容的来源地址。需要注意的是，如果你使用 &lt;span&gt;来代替 &lt;q&gt;标记引用内容,那么你就不能使用 cite属性了。</p>
<p>例如:</p>
<p><code>&lt;cite&gt;Designing with Web Standards&lt;/cite&gt; is an excellent book by Jeffrey Zeldman.5px;</code><code>&lt;p&gt; &lt;cite&gt;孔子&lt;/cite&gt;曰：&lt;q&gt;学而不思则罔，思而不学则殆&lt;/q&gt;.&lt;/p&gt;0px;</code> <code>&lt;p&gt;The W3C says that &lt;q cite="http://www.w3.org/TR/REC-html40/<br />
struct/text.html#h-9.2.1"&gt;The presentation of phrase elements<br />
depends on the user agent.&lt;/q&gt;.&lt;/p&gt;</code> <code>&lt;blockquote cite="http://www.w3cn.org/"&gt;<br />
　&lt;p&gt;“我们大部分人都有深刻体验，每当主流浏览器版本的升级，我们刚建立的网站就可能变得过时，<br />
　我们就需要升级或者重新建造一遍网站。例如1996-1999年典型的"浏览器大战"，<br />
　为了兼容 Netscape 和 IE，网站不得不为这两种浏览器写不同的代码。同样的，<br />
　每当新的网络技术和交互设备的出现，我们也需要制作一个新版本来支持这种新技术或新设备，<br />
　例如支持手机上网的 WAP 技术。类似的问题举不胜举：网站代码臃肿、繁杂浪费了我们大量的带宽；<br />
　针对某种浏览器的 DHTML 特效，屏蔽了部分潜在的客户；不易用的代码，残障人士无法浏览网站等等。<br />
　这是一种恶性循环，是一种巨大的浪费。”&lt;/p&gt;<br />
&lt;/blockquote&gt;</code></p>
<h2><a name="hd001006" title="hd001006"></a><strong>&lt;em&gt;、 &lt;strong&gt;</strong></h2>
<p>&lt;em&gt; 是用作强调的，&lt;strong&gt;是用作重点强调的。 大部分浏览器用斜体显示强调的内容，用粗体来显示重点强调的内容，然而，这是没有必要的，如果是为了确定强调内容的显示方式，最好的方法就是使用CSS来定义他们的表现。当你想要的只是视觉上的效果时，就不要使用强调了。而且如果你想要强调但是还觉得粗体或者斜体不视觉效果没那么好，特别是斜体对于中文来说，那么你完全可以定义一些其他的比较醒目的样式达到强调的效果。<br />
例如:</p>
<p><code>&lt;p&gt;&lt;em&gt;强调&lt;/em&gt; 的文本通常用斜体显示，<br />
然而， &lt;strong&gt;特别强调&lt;/strong&gt; 的文本通常以粗体显示。&lt;/p&gt;x 0;</code></p>
<h2><a name="hd001007" title="hd001007"></a><strong>&lt;table&gt;、&lt;td&gt;、&lt;th&gt;、&lt; caption &gt;、 summary</strong></h2>
<p>XHTML中的表格不应用来布局。然而如果是为了标记列表的数据，就应该使用表格了。&lt;th&gt;为表格标题，属性summar为摘要，&lt;caption&gt;标签为首部说明，&lt;thead&gt;标签为表格头部，&lt;tbody&gt;标签为表格主体内容，&lt;tfoot&gt;标签为表格尾部。<br />
其中还可以使用scope 可用于取代headers属性，标记含有表头信息的单元格，其中各数值的内容如下：<br />
row 指示当前单元格，为包含当前单元格的行提供相关的表头信息。<br />
col 指示当前单元格，为根据当前单元格指定的列提供相应的表头信息。<br />
rowgroup 指示当前单元格，为包含当前单元格的其余行组提供相关的表头信息。<br />
colgroup 指示当前单元格，为根据当前单元格指定的其余列组提供相应的表头信息。<br />
abbr 用于定义表头单元格中的缩写名，如果没有定义该属性，则将默认单元格内容为节略形式。<br />
例如:</p>
<p><code>&lt;table id="mytable" cellspacing="0" summary="The technical specifications of the Apple PowerMac G5 series"&gt;<br />
&lt;caption&gt;Table 1: Power Mac G5 tech specs &lt;/caption&gt;<br />
　&lt;tr&gt;<br />
　 &lt;th scope="col" abbr="Configurations" class="nobg"&gt;Configurations&lt;/th&gt;<br />
　 &lt;th scope="col" abbr="Dual 1.8"&gt;Dual 1.8GHz&lt;/th&gt;<br />
　 &lt;th scope="col" abbr="Dual 2"&gt;Dual 2GHz&lt;/th&gt;<br />
　 &lt;th scope="col" abbr="Dual 2.5"&gt;Dual 2.5GHz&lt;/th&gt;<br />
　&lt;/tr&gt;<br />
　 &lt;tr&gt;<br />
　 &lt;th scope="row" abbr="Model" class="spec"&gt;Model&lt;/th&gt;<br />
　&lt;td&gt;M9454LL/A&lt;/td&gt;</code><code>　&lt;td&gt;M9455LL/A&lt;/td&gt;<br />
　&lt;td&gt;M9457LL/A&lt;/td&gt;<br />
　&lt;/tr&gt;<br />
　&lt;tr&gt;<br />
　&lt;th scope="row" abbr="G5 Processor" class="specalt"&gt;G5 Processor&lt;/th&gt;<br />
　&lt;td class="alt"&gt;Dual 1.8GHz PowerPC G5&lt;/td&gt;<br />
　&lt;td class="alt"&gt;Dual 2GHz PowerPC G5&lt;/td&gt;</p>
<p>　&lt;td class="alt"&gt;Dual 2.5GHz PowerPC G5&lt;/td&gt;<br />
　&lt;/tr&gt;<br />
　&lt;tr&gt;<br />
　&lt;th scope="row" abbr="Frontside bus" class="spec"&gt;Frontside bus&lt;/th&gt;<br />
　&lt;td&gt;900MHz per processor&lt;/td&gt;<br />
　&lt;td&gt;1GHz per processor&lt;/td&gt;<br />
　&lt;td&gt;1.25GHz per processor&lt;/td&gt;</p>
<p>　&lt;/tr&gt;<br />
　&lt;tr&gt;<br />
　&lt;th scope="row" abbr="L2 Cache" class="specalt"&gt;Level2 Cache&lt;/th&gt;<br />
　&lt;td class="alt"&gt;512K per processor&lt;/td&gt;<br />
　&lt;td class="alt"&gt;512K per processor&lt;/td&gt;<br />
　&lt;td class="alt"&gt;512K per processor&lt;/td&gt;<br />
　&lt;/tr&gt;</p>
<p>&lt;/table&gt;</p>
<p></code>效果察看：<a target="_blank" href="http://www.blueidea.com/articleimg/2006/02/3228/csstables.htm"><font color="#1e90ff">http://www.blueidea.com/articleimg/2006/02/3228/csstables.htm</font></a></p>
<h2><a name="hd001008" title="hd001008"></a><strong>&lt;dfn&gt;</strong></h2>
<p><code>&lt;p&gt;&lt;dfn title="Microsoft web browser"&gt;Internet Explorer&lt;/dfn&gt; is the most popular browser used underwater.&lt;/p&gt;</code></p>
<h2><a name="hd001009" title="hd001009"></a><strong>&lt;ins&gt;, &lt;del&gt;</strong></h2>
<p><strong>&lt;ins&gt;, &lt;del&gt;</strong></p>
<p>知道del，就不要再用&lt;s&gt;做删除线了，用del显然更具有语义化。而且del还带有cite和datetime来表明删除的原因以及删除的时间。ins是表示插入，也有这样的属性。<br />
例如：</p>
<p><code>&lt;p&gt;It really was &lt;ins cite="rarara.html" datetime="20031024"&gt;very&lt;/ins&gt; good.&lt;/p&gt;</code></p>
<p>在某些老式浏览器中，继承功能可能有些问题，然而大部分现代浏览器在这方面都处理得很正确。记住上面这个列表，可以让你少写点多余的代码。当然了，如果你想看看完整的列表，还是参考 CSS 2 Property Index。</p>
<h2><a name="hd001010" title="hd001010"></a><strong>&lt;code&gt;</strong></h2>
<p>表示是计算机代码。而默认样式为打字体。技术论坛和blog中经常遇到。<br />
例如：</p>
<p><code>&lt;code&gt;p{margin:2px 0;}&lt;/code&gt;</code></p>
<h2><a name="hd001011" title="hd001011"></a><strong>&lt;abbr&gt;、&lt;acronym&gt;</strong></h2>
<p>&lt;abbr&gt;标签是表示web页面上的简称，&lt;acronym&gt;标签为取首字母缩写。（注：这里把简称和缩写分开而论，简称范围比缩写大，取首字母的缩<br />
写用&lt;acronym&gt;标签）Windows的IE6.0以下的浏览器暂不支持&lt;abbr&gt;标签。 在IE里，你可以应用CSS给&lt;acronym&gt;但是不能应用给&lt;abbr&gt;标签，<br />
IE会为&lt;acronym&gt;标签的title属性显示提示，但是会忽略&lt;abbr&gt;标签。<br />
解决方法见: http://www.w3cn.org/article/translate/2005/115.html<br />
例如:</p>
<p><code>&lt;abbr title="Cascading Style Sheets"&gt;CSS&lt;/abbr&gt;</code> <code>&lt;acronym title="Cascading Style Sheets"&gt;CSS&lt;/acronym &gt;</code></p>
<h2><a name="hd001012" title="hd001012"></a><strong>alt属性和title属性</strong></h2>
<p>title属性用来为元素提供额外说明信息title属性可以用在除了base，basefont，head，html，meta，param，script和title之外的所有标签。但是并不是必须的。<br />
alt属性为不能显示图像、窗体或applets的用户代理（UA），指定替换文字。替换文字的语言由lang属性指定。</p>
<p><code>&lt;img src="/img/common/logo.gif" mce_src="/img/common/logo.gif" width="90" height="27" alt="bluediea.com"&gt;</code> <code>&lt;a href="http://www.jluvip.com/blog/article.asp?id=260" mce_href="http://www.jluvip.com/blog/article.asp?id=260" title="js获取单选按钮的数据"&gt;js获取单选按钮的数据&lt;/a&gt;</code></p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20080219/yuyihua-biaoqian/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>什么是数据挖掘(Data Mining)？</title>
		<link>http://www.sunbo.name/20071114/shuju-wajue</link>
		<comments>http://www.sunbo.name/20071114/shuju-wajue#comments</comments>
		<pubDate>Wed, 14 Nov 2007 06:44:33 +0000</pubDate>
		<dc:creator>孙波</dc:creator>
				<category><![CDATA[网络经济]]></category>
		<category><![CDATA[网站]]></category>
		<category><![CDATA[搜索引擎优化]]></category>

		<guid isPermaLink="false">http://www.sunbo.name/index.php/20071114/shuju-wajue.html</guid>
		<description><![CDATA[数据挖掘(Data Mining)，又称为数据库中的知识发现(Knowledge Discovery in Database, KDD)，就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程，简单的说，数据挖掘就是从大量数据中提取或“挖掘”知识。 与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义：数据源必须是真实的、大量的、含噪声的；发现的是用户感兴趣的知识；发现的知识要可接受、可理解、可运用；并不要求发现放之四海皆准的知识，仅支持特定的发现问题。 何为知识：从广义上理解，数据、信息也是知识的表现形式，但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉，好像从矿石中采矿或淘金一样。原始数据可以是结构化的，如关系数据库中的数据；也可以是半结构化的，如文本、图形和图像数据；甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的，也可以是非数学的；可以是演绎的，也可以是归纳的。发现的知识可以被用于信息管理，查询优化，决策支持和过程控制等，还可以用于数据自身的维护。因此，数据挖掘是一门交叉学科，它把人们对数据的应用从低层次的简单查询，提升到从数据中挖掘知识，提供决策支持。在这种需求牵引下，汇聚了不同领域的研究者，尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员，投身到数据挖掘这一新兴的研究领域，形成新的技术热点。 数据挖掘能做什么？ 1)数据挖掘能做以下六种不同事情（分析方法）： 分类 （Classification） 估值（Estimation） 预言（Prediction） 相关性分组或关联规则（Affinity grouping or association rules） 聚集（Clustering） 描述和可视化（Description and Visualization） 2)数据挖掘分类 以上六种数据挖掘的分析方法可以分为两类：直接数据挖掘；间接数据挖掘 直接数据挖掘 目标是利用可用的数据建立一个模型，这个模型对剩余的数据，对一个特定的变量（可以理解成数据库中表的属性，即列）进行描述。 间接数据挖掘 目标中没有选出某一具体的变量，用模型进行描述；而是在所有的变量中建立起某种关系。 分类、估值、预言属于直接数据挖掘；后三种属于间接数据挖掘 3)各种分析方法的简介 分类 （Classification） 首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分类模型，对于没有分类的数据进行分类。 例子： a. 信用卡申请者，分类为低、中、高风险 b. 分配客户到预先定义的客户分片 注意： 类的个数是确定的，预先定义好的 估值（Estimation） 估值与分类类似，不同之处在于，分类描述的是离散型变量的输出，而估值处理连续值的输出；分类的类别是确定数目的，估值的量是不确定的。 例子： a. 根据购买模式，估计一个家庭的孩子个数 b. 根据购买模式，估计一个家庭的收入 c. 估计real estate的价值 一般来说，估值可以作为分类的前一步工作。给定一些输入数据，通过估值，得到未知的连续变量的值，然后，根据预先设定的阈值，进行分类。例如：银行对家庭贷款业务，运用估值，给各个客户记分（Score 0~1）。然后，根据阈值，将贷款级别分类。 预言（Prediction） 通常，预言是通过分类或估值起作用的，也就是说，通过分类或估值得出模型，该模型用于对未知变量的预言。从这种意义上说，预言其实没有必要分为一个单独的类。 [...]]]></description>
			<content:encoded><![CDATA[<p>数据挖掘(Data Mining)，又称为数据库中的知识发现(Knowledge Discovery in Database, KDD)，就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程，简单的说，数据挖掘就是从大量数据中提取或“挖掘”知识。</p>
<p>与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义：数据源必须是真实的、大量的、含噪声的；发现的是用户感兴趣的知识；发现的知识要可接受、可理解、可运用；并不要求发现放之四海皆准的知识，仅支持特定的发现问题。<span id="more-545"></span></p>
<p>何为知识：从广义上理解，数据、信息也是知识的表现形式，但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉，好像从矿石中采矿或淘金一样。原始数据可以是结构化的，如关系数据库中的数据；也可以是半结构化的，如文本、图形和图像数据；甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的，也可以是非数学的；可以是演绎的，也可以是归纳的。发现的知识可以被用于信息管理，查询优化，决策支持和过程控制等，还可以用于数据自身的维护。因此，数据挖掘是一门交叉学科，它把人们对数据的应用从低层次的简单查询，提升到从数据中挖掘知识，提供决策支持。在这种需求牵引下，汇聚了不同领域的研究者，尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员，投身到数据挖掘这一新兴的研究领域，形成新的技术热点。</p>
<p>数据挖掘能做什么？</p>
<p>1)数据挖掘能做以下六种不同事情（分析方法）：</p>
<p>分类 （Classification）</p>
<p>估值（Estimation）</p>
<p>预言（Prediction）</p>
<p>相关性分组或关联规则（Affinity grouping or association rules）</p>
<p>聚集（Clustering）</p>
<p>描述和可视化（Description and Visualization）</p>
<p>2)数据挖掘分类</p>
<p>以上六种数据挖掘的分析方法可以分为两类：直接数据挖掘；间接数据挖掘</p>
<p>直接数据挖掘</p>
<p>目标是利用可用的数据建立一个模型，这个模型对剩余的数据，对一个特定的变量（可以理解成数据库中表的属性，即列）进行描述。</p>
<p>间接数据挖掘</p>
<p>目标中没有选出某一具体的变量，用模型进行描述；而是在所有的变量中建立起某种关系。</p>
<p>分类、估值、预言属于直接数据挖掘；后三种属于间接数据挖掘</p>
<p>3)各种分析方法的简介</p>
<p>分类 （Classification）</p>
<p>首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分类模型，对于没有分类的数据进行分类。</p>
<p>例子：</p>
<p>a. 信用卡申请者，分类为低、中、高风险</p>
<p>b. 分配客户到预先定义的客户分片</p>
<p>注意： 类的个数是确定的，预先定义好的</p>
<p>估值（Estimation）</p>
<p>估值与分类类似，不同之处在于，分类描述的是离散型变量的输出，而估值处理连续值的输出；分类的类别是确定数目的，估值的量是不确定的。</p>
<p>例子：</p>
<p>a. 根据购买模式，估计一个家庭的孩子个数</p>
<p>b. 根据购买模式，估计一个家庭的收入</p>
<p>c. 估计real estate的价值</p>
<p>一般来说，估值可以作为分类的前一步工作。给定一些输入数据，通过估值，得到未知的连续变量的值，然后，根据预先设定的阈值，进行分类。例如：银行对家庭贷款业务，运用估值，给各个客户记分（Score 0~1）。然后，根据阈值，将贷款级别分类。</p>
<p>预言（Prediction）</p>
<p>通常，预言是通过分类或估值起作用的，也就是说，通过分类或估值得出模型，该模型用于对未知变量的预言。从这种意义上说，预言其实没有必要分为一个单独的类。</p>
<p>预言其目的是对未来未知变量的预测，这种预测是需要时间来验证的，即必须经过一定时间后，才知道预言准确性是多少。</p>
<p>相关性分组或关联规则（Affinity grouping or association rules）</p>
<p>决定哪些事情将一起发生。</p>
<p>例子：</p>
<p>a. 超市中客户在购买A的同时，经常会购买B，即A =&gt; B(关联规则)</p>
<p>b. 客户在购买A后，隔一段时间，会购买B （序列分析）</p>
<p>聚集（Clustering）</p>
<p>聚集是对记录分组，把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先定义好的类，不需要训练集。</p>
<p>例子：</p>
<p>a. 一些特定症状的聚集可能预示了一个特定的疾病</p>
<p>b. 租VCD类型不相似的客户聚集，可能暗示成员属于不同的亚文化群</p>
<p> 聚集通常作为数据挖掘的第一步。例如，“哪一种类的促销对客户响应最好？”，对于这一类问题，首先对整个客户做聚集，将客户分组在各自的聚集里，然后对每个不同的聚集，回答问题，可能效果更好。</p>
<p>描述和可视化（Description and Visualization）</p>
<p>是对数据挖掘结果的表示方式。</p>
<p>2.数据挖掘的商业背景</p>
<p>数据挖掘首先是需要商业环境中收集了大量的数据，然后要求挖掘的知识是有价值的。有价值对商业而言，不外乎三种情况：降低开销；提高收入；增加股票价格。</p>
<p>1)数据挖掘作为研究工具 （Research）</p>
<p>2)数据挖掘提高过程控制（Process Improvement）</p>
<p>3)数据挖掘作为市场营销工具（Marketing）</p>
<p>4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management)</p>
<p>3.数据挖掘的技术背景</p>
<p>1)数据挖掘技术包括三个主要部分：算法和技术；数据；建模能力</p>
<p>2)数据挖掘和机器学习（Machine Learning）</p>
<p>机器学习是计算机科学和人工智能AI发展的产物</p>
<p>机器学习分为两种学习方式：自组织学习（如神经网络）；从例子中归纳出规则（如决策树）</p>
<p>数据挖掘由来</p>
<p>数据挖掘是八十年代，投资AI研究项目失败后，AI转入实际应用时提出的。它是一个新兴的，面向商业应用的AI研究。选择数据挖掘这一术语，表明了与统计、精算、长期从事预言模型的经济学家之间没有技术的重叠。</p>
<p>3)数据挖掘和统计</p>
<p>统计也开始支持数据挖掘。统计本包括预言算法（回归）、抽样、基于经验的设计等</p>
<p>4)数据挖掘和决策支持系统</p>
<p>数据仓库</p>
<p>OLAP（联机分析处理）、Data Mart（数据集市）、多维数据库</p>
<p>决策支持工具融合</p>
<p>将数据仓库、OLAP，数据挖掘融合在一起，构成企业决策分析环境。</p>
<p>4. 数据挖掘的社会背景</p>
<p>数据挖掘与个人预言：数据挖掘号称能通过历史数据的分析，预测客户的行为，而事实上，客户自己可能都不明确自己下一步要作什么。所以，数据挖掘的结果，没有人们想象中神秘，它不可能是完全正确的。</p>
<p>数据挖掘与传统分析方法的区别</p>
<p>数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识.数据挖掘所得到的信息应具有先未知,有效和可实用三个特征.</p>
<p>先前未知的信息是指该信息是预先未曾预料到的,既数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值.在商业应用中最典型的例子就是一家连锁店通过数据挖掘发现了小孩尿布和啤酒之间有着惊人的联系.</p>
<p><strong> 数据挖掘和数据仓库</strong></p>
<p>大部分情况下，数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中（见图1）。从数据仓库中直接得到进行数据挖掘的数据有许多好处。就如我们后面会讲到的，数据仓库的数据清理和数据挖掘的数据清理差不多，如果数据在导入数据仓库时已经清理过，那很可能在做数据挖掘时就没必要在清理一次了，而且所有的数据不一致的问题都已经被你解决了。</p>
<p><img width="337" src="http://www.138h.com/d/file/shimeshi/diannaotongxun/2007-10-23/dbaa441ed3ac7d910f8a43faa894e1cf.gif" height="162" /></p>
<p>数据挖掘库可能是你的数据仓库的一个逻辑上的子集，而不一定非得是物理上单独的数据库。但如果你的数据仓库的计算资源已经很紧张，那你最好还是建立一个单独的数据挖掘库。</p>
<p>当然为了数据挖掘你也不必非得建立一个数据仓库，数据仓库不是必需的。建立一个巨大的数据仓库，把各个不同源的数据统一在一起，解决所有的数据冲突问题，然后把所有的数据导到一个数据仓库内，是一项巨大的工程，可能要用几年的时间花上百万的钱才能完成。只是为了数据挖掘，你可以把一个或几个事务数据库导到一个只读的数据库中，就把它当作数据集市，然后在他上面进行数据挖掘。</p>
<p><img width="265" src="http://www.138h.com/d/file/shimeshi/diannaotongxun/2007-10-23/22dff4fd9dadf4cbaa657209fccdeadb.gif" height="89" /></p>
<p>客户的行为是与社会环境相关连的，所以数据挖掘本身也受社会背景的影响。比如说，在美国对银行信用卡客户信用评级的模型运行得非常成功，但是，它可能不适合中国。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sunbo.name/20071114/shuju-wajue/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

