搜索引擎“蜘蛛”是指什么 蜘蛛搜索引擎在线搜索


搜索引擎蜘蛛爬行是什么_请问搜索引擎蜘蛛爬行程序的来源搜索引擎收录网页提供用户搜索获识,搜索引擎什么网页都收录吗?搜索引擎怎么收录网页呢?搜索引擎就是靠一个程序,他就是搜索引擎蜘蛛 。
搜索引擎蜘蛛来源:由于专门用于检索信息的“机器人”程序就象蜘蛛一样在网络间爬来爬去,反反复复,不知疲倦 。所以,搜索引擎的“机器人”程序就被称为“蜘蛛”程序 。
每个搜索引擎都有他们自己的蜘蛛程序,你的网站如果不去蜘蛛的话,你的网站排名就不会很好,你网站的内容页面也不会收录!只要蜘蛛天天都去你的网站,你网站的百度快照就会每天更新 。
搜索引擎蜘蛛:
http://www.yongqiangqiang.com/8_2/84/
搜索引擎蜘蛛的作用是什么搜索引擎蜘蛛
,又称网页蜘蛛 。
作用是抓取各个网站上的内容 。简单来说,网站上的内容如果要想被
搜索引擎收录
,就必须要经过网页蜘蛛的索引 。
目录类搜索引擎有哪些
问题一:目录索引类,元,全文搜索引擎有哪些?搜索引擎按照工作方式可以分为三类:1、目录搜索引擎:目录搜索引擎主要有yahoo!、LookSmart、About、DMOZ、Galaxy等 。2、全文搜索引擎:全文搜索引擎主要有Google、百度、AltaVista、Inktomi、Alltheweb等 。3、元搜索引擎:元搜索引擎主要有InfoSpace、Dogpile、Vivisimo、北大天网、搜狐、Lycos、Meta crawler等 。
问题二:目录索引类搜索引擎有哪些一般是分普通网站内容和音乐两种 百度 google Yahoo雅虎 搜狐搜索 新浪搜索 网易搜索 中搜 天网搜索 中华搜索 极限搜索 网蛙搜索 3721搜索 QQ搜索 TOM搜索
问题三:目录索引搜索引擎有哪些百度 google Yahoo雅虎 搜狐搜索 新浪搜索 网易搜索 中搜 天网搜索 中华搜索 极限搜索 网蛙搜索 3721搜索TOM搜索
问题四:目录搜索用什么搜索引擎搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine) 。
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu) 。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎 。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎 。
目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已 。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息 。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎 。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等 。国内的搜狐、新浪、网易搜索也都属于这一类 。
元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户 。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎 。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo 。
除上述三大类引擎外,还有以下几种非主流形式:
1、 *** 式搜索引擎:如HotBot在2002年底推出的引擎 。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“ *** 式”搜索引擎更确切些 。
2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎 。
3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多 。
【搜索引擎“蜘蛛”是指什么 蜘蛛搜索引擎在线搜索】google中支持的有:pdf、ps、doc、ppt、xls、rtf
搜索格式为:internet filetype:doc
请采纳 。
问题五:人工分类目录型的搜索引擎有那些搜索引擎主要有目录式搜索引擎、关键词全文搜索引擎和元搜索引擎三类 。区别是目录式搜索引擎是基于目录检索,关键词全文搜索引擎是基于关键词搜索,元搜索引擎是搜索引擎的搜索引擎,没有自己的搜索引擎 。
问题六:搜索引擎的主要体系包括哪些搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统 。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、 *** 式搜索引擎、门户搜索引擎与免费链接列表等 。
全文索引
搜索引擎分类部分提到过全文搜索引擎从网站提取信息建立网页数据库的概念 。搜索引擎的自动信息搜集功能分两种 。一种是定期搜索,即每隔一段时间(比如Google一般是28天),
蜘蛛搜索引擎
搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库 。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询 。随着搜索引擎索引规则发生很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录 。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法――通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量――计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户 。这种引擎的特点是搜全率比较高 。
目录索引
目录索引也称为:分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引 。目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源 。
虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已 。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询 。
与全文搜索引擎相比,目录索引有许多不同之处 。
首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作 。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站 。其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功;而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功 。尤其像Yahoo这样的超级索引,登录更是困难 。
此外,在登录搜索引擎时,一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory) 。
最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自 *** ;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制 。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的 。
搜索引擎与目录索引有相互融合渗透的趋势 。一些纯粹的全文搜索引擎也提供目录搜索,如Google就借用Open Directory目录提供分类查询 。而像Yahoo! ;这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围(注) 。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如中国的搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo 。这种引擎的特点是找的准确率比较高 。
元搜索......>>
问题七:搜索引擎有哪四大类,每一种类型的代表是那些搜索引擎1.全文索引
全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索 。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果 。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎 。
2.目录索引
目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已 。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询 。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索 。
3.元搜索引擎
元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户 。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎 。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo 。
其他非主流搜索引擎形式
(1) *** 式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎 。
(2)门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎 。
(3)免费链接列表(Free For All Links,简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多 。
问题八:搜索引擎都有哪几种类型搜索引擎主要分类,及特点:
一、全文索引
全文搜索引擎是目前广泛应用的主流搜索引擎,国外代表搜索是Google,国内则有最大中文搜索百度 。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果 。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和360搜索就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎 。
二、目录索引
目录索引也称为:分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引 。目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源 。
三、元搜索引擎
元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户 。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎 。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo 。
四、垂直搜索引擎
垂直搜索引擎为2006年后逐步兴起的一类搜索引擎 。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验 。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样 。
五、 *** 式搜索引擎
*** 式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎 。
六、门户搜索引擎
门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎 。
七、免费链接列表
免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多 。
希望可以帮助到你~望采纳哦~谢谢~ 看评论
问题九:什么是目录搜索国内一般把搜索引擎分为分类搜索引擎和关键词搜索引擎,国外则分别称其为Directory和Search engine 。Directory是指一种主题分类目录,由人工对网站进行标引和组织(hand-picked web sites organized into categories),提供分类检索;Search engine是基于蜘蛛程序的搜索引擎(Spider-Based Search Engine),由程序自动索引网页建立数据库,提供关键词搜索 。搜索引擎是工具性实体,分类搜索和关键词搜索是搜索引擎的功能特征和网络信息的检索方法 。分类搜索是最早出现的一种网络信息检索方法,主题分类目录的创制已有相当成熟的理论、技术和丰富的成功经验 。Yahoo!被认为是分类搜索的鼻祖,Directory的代表,引领着分类搜索的潮流 。搜狐(搜狗)开中文分类搜索先河,其50,000主题分类,500,000优选网站无愧中文主题分类目录的典范,堪称中文分类搜索的旗舰 。1、何谓分类搜索 分类搜索是基于人工标引的检索方法 。它以科学、实用的分类目录为工具,以规范化的自然语言为类名,在对网络信息归纳、概括的基础上,以网站为单元,提供经过专家评价和人工整序的网络信息 。分类搜索是突出族性特征的检索方法 。由于分类目录已按照学科或主题对网络信息进行了标引,所有网站在分类体系中同聚异分,各有所属,纵向成枝,横向成网,只需按图索骥,同一类属或相关主题的信息即可循类以求,适用于查询具有同一特征的多个目标和主题范围广、概念宽泛的问题 。分类搜索是关键词搜索不可替代的检索方法 。关键词搜索以简单、快捷著称,但庞大的结果列表、大量重复和无用的信息是其永远的伤痛 。而分类搜索恰恰独具优势,经过人工编辑的检索结果既以精当、准确著称,又以系统、有效见长 。分类搜索是循序渐进的检索方法 。与关键词搜索即刻按照相关性递减顺序返回大量结果不同,分类搜索要首先确定所需信息在目录中的类系归属和相关路径,从大类入手,逐级浏览,渐进查询,在相应类目下按字顺展开网站列表,然后再根据网站名称和简介,对结果列表进行选择 。分类搜索是门户网站不可缺少的检索方法 。互联网上搜索的概念最早来自于门户网站,资深网民对互联网的认识最初几乎全部来自于当年yahoo!提供的分类搜索服务 。有关数据显示,我国将近70%以上网民是通过门户网站认识和开始使用搜索引擎的 。门户网站是使用搜索引擎的主要平台,搜索引擎也为门户网站带来了巨大的经济利益和访问流量 。2、分类搜索的原理 分类搜索的基础和前提是构建一个反映网站相关信息及其URL链接的目录指南(Directory),在这个目录中,经过审核与标引的网站按学科或主题分门别类、有序排列 。分类搜索就是在分类目录中,根据所需信息的学科属性或主题内容,逐级检索,循类以求 。由于分类目录是以数据库形式存在的,也可以说,分类搜索就是对分类数据库的检索 。分类搜索建立在网络分类的基础上,了解分类搜索的原理,不能不首先了解网络分类体系 。分类标准、类目划分、类目设置、类目序列等,对分类体系的构建至关重要,决定着分类目录的性质和功能,影响着分类搜索的效率和效果 。系统性和实用性是对网络信息分类的基本要求,以学科性质为标准可以保证分类的系统性,以事物主题为......>>
问题十:中国主要的搜索引擎有哪几个?百度(baidu)中文搜索引擎
全球最大中文搜索引擎 。提供网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索、百度搜霸、搜索援助中心 。
北大天网中英文搜索引擎
由北京大学开发,简体中文、繁体中文和英文三个版本 。提供全文检索、新闻组检索、FTP检索(北京大学、中科院等FTP站点) 。目前大约收集了100万个WWW页面(国内)和14万篇Newsgroup(新闻组)文章 。支持简体中文、繁体中文、英文关键词搜索,不支持数字关键词和URL名检索 。
新浪搜索引擎
互联网上规模 最大的中文搜索引擎之一 。设大类目录18个,子目1万多个,收录网站20余万 。提供网站、中文网页、英文网页、新闻、汉英辞典、软件、沪深行情、游戏等多种资源的查询 。
雅虎中国搜索引擎
Yahoo!是世界上最著名的目录搜索引擎 。雅虎中国于1999年9月正式开通,是雅虎在全球的第20个网站 。Yahoo!目录是一个Web资源的导航指南,包括14个主题大类的内容 。
搜狐搜索引擎
搜狐于1998年推出中国首家大型分类查询搜索引擎,到现在已经发展成为中国影响力最大的分类搜索引擎 。每日页面浏览量超过800万,可以查找网站、网页、新闻、网址、软件、黄页等信息 。
网易搜索引擎
网易新一代开放式目录管理系统(ODP) 。拥有近万名义务目录管理员 。为广大网民创建了一个拥有超过一万个类目,超过25万条活跃站点信息,日增加新站点信息500~1000条,日访问量超过500万次的专业权威的目录查询体系 。
3721网络实名/智能搜索
3721公司提供的中文上网服务?D?D3721网络实名,使用户无须记忆复杂的网址,直接输入中文名称,即可直达网站 。3721智能搜索系统不仅含有精确的网络实名搜索结果,同时集成多家搜索引擎 。
360综合搜索引擎
搜索引擎“蜘蛛”是指什么?1.spider对一个网站服务器造成的访问压力如何?
答:uspider会自动根据服务器的负载能力调节访问密度 。在连续访问一段时间后,、spider会暂停一会,以防止增大服务器的访问压力 。所以在一般情下,对您网站的服务器不会造成过大压力 。
2.为什么spider不停的抓取我的网站?
答:对于您网站上新产生的或者持续更新的页面,spider会持续抓取 。此外,您也可以检查网站访问日志中spider的访问是否正常,以防止有人恶意冒充spider来频繁抓取您的网站 。
3.我不想我的网站被spider访问,我该怎么做?
答:spider遵守互联网robots协议 。您可以利用robots.txt文件完全禁止spider访问您的网站,或者禁止spider访问您网站上的部分文件 。
4.为什么我的网站已经加了robots.txt,还能在百度搜索出来?
答:因为搜索引擎索引数据库的更新需要时间 。虽然spider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要二至四周才会清除 。另外也请检查您的robots配置是否正确 。
5.我希望我的网站内容被百度索引但不被保存快照,我该怎么做?
答:spider遵守互联网meta robots协议 。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照 。
和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效 。
6.Baiduspider多长时间之后会重新抓取我的网页?
答:百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间,Baiduspider会重新访问和更新一个网页 。
7.Baiduspider抓取造成的带宽堵塞?
答:Baiduspider的正常抓取并不会造成您网站的带宽堵塞,造成此现象可能是由于有人冒充baidu的spider恶意抓取 。如果您发现有名为Baiduspider的agent抓取并且造成带宽堵塞,请尽快和我们联系 。您可以将信息反馈至百度网页投诉中心,如果能够提供您网站该时段的访问日志将更加有利于我们的分析 。
什么是搜索蜘蛛?搜索引擎“蜘蛛”指的是网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取信息的程序或者脚本 。
基于目标网页特征的爬虫所抓取、存储并索引的对象一般为网站或网页 。根据种子样本获取方式可分为:
(1) 预先给定的初始抓取种子样本;
(2) 预先给定的网页分类目录和与分类目录对应的种子样本,如Yahoo!分类结构等;
(3) 通过用户行为确定的抓取目标样例,分为:
(a) 用户浏览过程中显示标注的抓取样本;
(b) 通过用户日志挖掘得到访问模式及相关样本 。
其中,网页特征可以是网页的内容特征,也可以是网页的链接结构特征等等 。
蜘蛛引擎靠什么跳
靠数据库跳 。蜘蛛在网页上爬取到的链接就会放在一个单独的数据库里面,这些数据库都有自己的属性,通常后缀都有相关的域 名信息,然后蜘蛛就会把这些域名后缀链接放到数据库,逐个爬取,很多人可能以为蜘蛛是通过点开链接的方式来爬行的,这自然是一种误解,如果算法是这样,那 效率是极其低下的!蜘蛛还可以通过反链来爬取,而且通过发链爬取的次数越多,蜘蛛就会认为你网站非常受欢迎,从而就会给你网站赋予更高的权重
关于蜘蛛搜索引擎和蜘蛛搜索引擎在线搜索的内容就分享到这儿!更多实用知识经验,尽在 www.hubeilong.com