2.因特网与TCP/IP
TCP/IP是因特网的核心,利用TCP/IP协议可以方便地实现多个网络的连接。
一台主机只要在物理上接入因特网,分配一个因特网地址(IP地址),并运行TCP/IP协议,就可以向因特网上的所有其他主机发送IP分组,进行通信。
TCP/IP体系结构的层次模型为四层,最高层为应用层,包括所有的应用协议,如常见的文件传输协议FTP、电子邮件SMTP、域名系统DNS、网络管理协议SNMP、超文本传输协议HTTP等。
TCP/IP的第三层为传输层,负责在源主机和目的主机之间提供端~端(主机~主机)的数据传输服务。这一层上主要定义了两个协议:面向连接的传输控制协议TCP和无连接的用户数据报协议UDP。
TCP/IP的第二层为互联层,负责将分组独立地从信源传送到信宿,主要解决路由选择、阻塞控制及网际互联问题。这一层上定义了互联网协议IP、地址转换协议ARP、反向地址转换协议RARP和互联网控制报文协议ICMP等协议。
TCP/IP的最低层为网络接口层,负责将IP分组封装成适合在物理网络上传输的帧格式并发送出去,或将从物理网络接收到的帧拆装并取出IP分组递交给上一层。
该层与物理网络的具体实现有关,自身并无专用协议。虽然该层一般不需要专门的TCP/IP协议,各物理网络可使用自己的数据链路层协议和物理层协议,但考虑到用户使用串行线路接入因特网(如通过电话线上网),仍规定了SLIP或PPP协议。
3.标识技术
(1)因特网计算机标识:主机IP地址。为了确保通信时能相互识别,因特网上的每台主机都必须有一个唯一的标识,即主机IP地址。IP协议就是根据IP地址进行信息传递的。
IP地址由32位(即4个字节)二进制数组成,为书写方便起见,将每个字节换算成十进制数来表示,每字节间用“。”分隔,如202.96.209.5。
IP地址由网络标识和主机标识两部分组成。常用的IP地址分为A、B、C三类,每一类都规定了网络标识和主机标识在32位中所占的位数。这三类IP地址表示范围分别为:
A类地址:0.0.0.0~127.255.255.255
B类地址:128.0.0.0~191.255.255.255
C类地址:192.0.0.0~223.255.255.255
A类地址一般分配给具有大量主机的网络使用,B类地址通常分配给中等规模的网络使用,C类地址通常分配给小型局域网使用。为了确保唯一性,IP地址由世界各大地区的权威机构Inter NIC(Internet Network Information Center)管理和分配。
在IP地址的某个网络标识中,可以包含大量的主机(如A类地址的主机标识域为24位、B类地址的主机标识域为16位),而在实际应用中不可能将这么多的主机连接到单一的网络中,这将给网络寻址和管理带来不便。为解决这个问题,引入了“子网”的概念。
将主机标识域进一步划分为子网标识和子网主机标识,通过灵活定义子网标识的位数,可以控制每个子网的规模。将一个大型网络划分为若干个既相对独立又相互联系的子网后,网络内部各子网便可独立寻址和管理,各子网间通过跨子网的路由器连接,这样也提高了网络的安全性。
利用子网掩码可以判断两台主机是否在同一子网中。子网掩码与IP地址一样也是32位二进制数,不同之处是它的网络标识和子网标识部分为全“1”,子网主机标识部分为全“0”。若两台主机的IP地址分别与它们的子网掩码相“与”后的结果相同,则说明这两台主机在同一子网中。
(2)因特网服务器标识:域名系统。32位二进制数的IP地址对计算机来说十分有效,但用户使用和记忆都很不方便。为此,因特网定义了主机域名。主机域名采用层次结构的基于“域”的命名方案,域名、子域名间用“。”分隔,其格式为:机器名。网络名。机构名。最高域名。通信时必须首先将主机域名转换成IP地址。
因特网上的域名由域名系统DNS(Domain Name System)统一管理。DNS是一个分布式数据库系统,由域名空间、域名服务器和地址转换请求程序三部分组成。
DNS域名服务采用客户/服务器(client/server)工作模式。地址转换请求程序作为TCP/IP的一部分被安装在客户机上,当用户用域名访问某服务器时自动运行——发送域名解析的请求至域名服务器。
域名服务器负责管理存放主机名和IP地址的数据库文件,以及域中的主机名和IP地址映射。域名服务器分布在不同的地方,它们之间通过特定的方式进行联络,这样可以保证用户通过本地的域名服务器查找到因特网上所有的域名信息。
所有域名服务器中的主机和IP地址集合组成DNS域名空间。
(3)因特网网页标识:URL统一资源定位器。WWW上的每一个网页都有一个独立的地址,这些地址称为统一资源定位器,其格式为:协议://主机域名/网页文件路径和文件名,其中最后一部分可以省略。只要知道某网页的URL,便可直接打开该网页。
(4)因特网邮箱用户标识:E-mail地址。用户E-mail地址的格式为:用户名@主机域名。其中用户名是用户在邮件服务器上的信箱名,通常为用户的注册名,主机域名则是邮件服务器的域名。例如,hmchang@online.sh.cn即表示域名为“online.sh.cn”的邮件服务器上的用户“hmchang”的E-mail地址。由于主机域名在因特网上的唯一性,所以,只要E-mail地址中用户名在该邮件服务器中是唯一的,则这个E-mail地址在整个因特网上也是唯一的。
此外,因特网上还有如QQ号、、MSN号、各网站上注册的用户名、ID等多种用户标识,此处不一一赘述。
4.搜索引擎
搜索引擎是解决用户在因特网海量信息中有目的快速查阅的有效工具。搜索引擎的技术也是不断发展的,目前最受全球网民欢迎的是Google和百度。1998年美国斯坦福大学的博士生佩奇(Larry Page)和布林(Sergey Brin)毕业后创办了Google公司,他们预见到未来人们会更主动地进行网络搜索,因此开发的产品要将全世界的信息集合起来,用户不论出于何种原因何时需要都可以从他们的产品中得到。如何在更大范围内更快地实现检索,已经不再是搜索引擎最重要的目标了,以最快的速度得到最有价值的搜索结果才是问题的关键。Google以独有的Pagerank(国内译为“网页快照”)技术解决了这一问题,其页面简洁,功能强大,可防止商业因素干扰搜索结果的排列;关键词完全匹配技术,可将最有效的结果返回;关键字定位预览,可以选择最有用的结果;数以万计的服务器,可以提供最快的检索速度;搜索面超过20亿个网页,收录超过3.3亿张图像;提供74种语言搜索服务,包括2000年推出的中文简繁体搜索页面。
百度于1999年成立于美国硅谷,创建者是在美国硅谷有多年成功经验的李彦宏和徐勇,2000年初回国发展并申请了中国互联网技术领域第一个自主知识产权,目前百度已开发出一系列具有世界领先水平的信息检索软件产品和技术,都取得了相当大的成功。
百度的主要产品有:基于全球互联网的中文网页检索,这条产品线主要服务于门户网站,客户包括Sina、Sohu、Tom.com、263在线、21CN、上海热线、广州视窗等;企业级信息检索解决方案,包括网事通系列软件及百度企业竞争情报系统,其中,网事通系列软件包括网站站内检索系统、行业垂直检索系统、新闻监控系统、企业垂直检索系统、实时信息系统及信息采集系统,目前,这些企业级的信息检索解决方案正服务于各个不同领域,包括电信企业、金融企业、传媒领域等。此外,百度还利用遍布全国的庞大CDN网络提供信息传递技术(即网站加速及网络缓存技术)。
目前,因特网上的搜索引擎主要有以下几类:
全文搜索引擎是名副其实的搜索引擎,上文提到的Google和百度都是全文搜索引擎。它们从因特网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的网页抓取、索引、检索系统(Indexer),有独立的“蜘蛛”(Spider)程序、或爬虫(Crawler)、或“机器人”(Robot)程序(这三种称呼意义相同),能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户可以按照分类目录找到所需信息,不依靠关键词进行查询。目录索引中最具代表性的有Yahoo、新浪分类目录搜索。
元搜索引擎(META Search Engine)在接收到用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。元搜索引擎主要有Info Space、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
垂直搜索引擎是2006年后逐渐兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询方式多样。
其他非主流搜索引擎形式有:
集合式搜索引擎:类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如Hot Bot在2002年底推出的搜索引擎。
门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。
免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo等目录索引小很多。
尽管搜索引擎只是一个工具,但实际上已成为网上重要的集成新闻源和信息源。
三、因特网接入技术
1.拨号接入(MODEM接入)
即电话线接入方式,调制解调器MODEM负责把计算机的数字信号转换为电话线可以传输的模拟信号,接收端负责相反的转换。目前MODEM的下行速率最高可达56Kbps,而上行速率只有33.6Kbps。但由于近几年因特网的飞速发展和宽带接入费用的下调,这种接入方式已经很少了。
2.ISDN接入
ISDN综合业务数字网提供端到端的数字连接,可以使用同一个网络承载各种话音和非话音业务,如传真、电话、因特网接入。ISDN基本速率接口包括两个能独立工作的64Kbps的B信道和一个16Kbps的D信道,选择ISDN2B+D端口的一个B信道上网,速度可达64Kbps。若两个B信道通过软件结合在一起使用,通信速率则可达到128Kbps。