与计算机自动搜索型一样,人工分类目录型的整个工作过程也分为收集信息、、分析信息、查询信息三个部分,但人工分类目录型主要依靠人工来收集和分析信息。一般人工分类目录类型都有专门的编辑,负责收集网站信息。随着收录网站越来越多,现在一般都是网站管理员将其网站信息提交给人工分类和日志类型,然后人工分类和目录类型的编辑对提交的网站进行审核,决定是否收录该网站。如果网站获得批准,手动分类目录类型的编辑还需要分析网站的内容,并将网站放在相应的类别和目录中。所有这些被收录的网站也储存在一个“索引数据库”中。用户查询信息时,可以选择按关键字搜索,也可以通过人工分类目录逐层搜索。如果按关键词搜索,返回的结果和电脑自动搜索的结果是一样的,网站是按信息相关度排列的。需要注意的是,基于人工分类目录的关键词查询只能在网站名称、、网站地址、等内容中进行,其查询结果仅为被收录网站首页的URL地址,而非具体页面。手动分类目录类型类似于电话簿。根据每个网站的性质,将其网址分类在一起。大类下有小类,一直到各个网站的详细地址,一般都会提供各个网站的内容简介。用户可以不使用关键字进行查询。他们只要找到相关的目录,就可以完整的找到相关的两个站(注意:是相关的网站,不是这个网站的一个网页的内容,或者一个目录里的网站。
3.主要工作步骤
无论是计算机自动搜索型还是人工分类目录型,搜索引擎的主要工作步骤如下。
1)从互联网上抓取网页
从网上抓取网页,通过“网络蜘蛛”或人工采集的方式存储在数据库中。
2)建立索引数据库分析索引系统程序对收集到的网页进行分析,提取相关网页信息(包括关键词、、关键词位置、、、与其他网页的链接关系等。),按照一定的关联算法进行大量复杂的计算,得出每个网页对于页面内容和超链接中每个关键词的相关度(或重要度),然后利用这些
3)在索引数据库中搜索和排序。
用户输入关键词搜索后,搜索系统程序从网页索引数据库中找到所有符合该关键词的相关网页。因为所有相关网页对于这个关键词的相关度都已经计算好了,所以只需要按照可用的相关度值进行排序,相关度越高,排名越高。最后,页面生成系统组织搜索结果的链接地址和页面内容摘要并返回给用户。
百度:https://ziyuan.baidu.com/ (需登录提交)360:http://info.so.360.cn/site_submit.html (可直接提交)搜狗:http://zhanzhang.sogou.com/index.php/sitelink/index (需登录提交)谷歌:http://www.google.cn/intl/zh-CN/add_url.html (google中国已关闭)移动搜索:头条:https://zhanzhang.toutiao.com/page/inner/site/add (需登录提交)神马:https://zhanzhang.sm..