1、计算机网络:自顶向下方法与互联网特色学习指南Study GuideComputer Networking-A Top-Down Approach Featuring the Internet计算机网络教研室译2006年4月1目 录Chapter 1-Computer Networks and the Internet2重要概念和思想2复习题(review questions)4复习题答案7Chapter 2-Application Layer10重要概念和思想10复习题(review questions)11复习题答案16Chapter 3-Transport Layer23重要概念和思想23
2、复习题 (review questions)25复习题答案32Chapter 4-The Network Layer41重要理论和思想41复习题(review questions)43复习题答案49Chapter 5-The Link Layer and the Local Area Network56重要概念和思想56复习题(review questions)60复习题答案63Chapter1-Application LayerChapter 1-Computer Networks and the Internet重要概念和思想1. Nuts and bolts of computer ne
3、tworks:计算机网络的组成包括端系统(end systems)、分组交换机(packet switches)和通信链路(communication links)。端系统也叫做主机(host),包括PC、膝上型计算机(laptops,如笔记本),以及像手机、PDA(个人数字助理)等的手持设备、传感器(sensors)和服务器(Web服务器、邮件服务器等)。与利用公路和立交桥组成的网络连接多个城市类似,计算机网络中的端系统利用由通信链路和分组交换机组成的网络互联起来。通信链路可以是有线的,也可以是无线的。2. 分布式应用(distributed applications):计算机网络使得分布式
4、应用系统成为可能。分布式应用系统运行在端系统上,通过计算机网络相互交换数据。分布式应用系统包括:网上冲浪(Web surfing)、电子邮件(e-mail)、即时通信(instant messaging)、网络电话(Internet phone)、分布式游戏、对等式文件共享(peer-to-peer file sharing)、电视发布、视频会议(video conferencing)等。随着Internet应用的日益深入,新的分布式应用系统正不断涌现。3. Packet switching分组交换:当一个端系统向另一个端系统发送数据时,发送端将数据分成一个一个的数据块(chunks),这些数
5、据块叫做分组(packet)。同邮政系统分发邮件的过程类似,Internet独立地处理每个分组并将其向目的端系统传输。当分组交换机收到一个分组后,利用分组携带的目的地址确定传输分组所需使用的输出链路。因此,一个分组交换机执行“分组交换”,将到达的分组一个一个地从输出链路转发(forwarding)出去。另外,分组交换机在转发分组时采用存储转发(store and forward)方式,即交换机只有在完整地收到并存储下整个分组后才开始将分组从输出链路上转发出去。4. 协议(Protocol):协议定义两个或多个通信实体(entity)之间所交换数据的格式、顺序,以及在收到/发送消息时/后所采取的
6、动作。计算机网络广泛采用了协议。课本第7页图1.2给出了在Web浏览器和Web服务器之间交换消息所采用的网络协议,以及两个人相互交谈所采用的类似协议。这个例子中,Web浏览器首先向服务器发送一个介绍性的消息;接着,服务器向浏览器发送一个介绍性消息作为响应;然后,浏览器向服务器发送一个请求某特定Web页面的消息;最后,服务器向浏览器发送一个包含了浏览器所请求Web页面的消息。5. 电路交换(Circuit-Switching):计算机网络是通信网络的主要类型之一。通信网络的另外一种主要类型是传统电话网络。传统数字电话网络使用叫做电路交换(Circuit-Switching)的方式,而不是计算机网
7、络所采用的分组交换,将数据从源端传输到目的端。电路交换中,在两个端系统正式传输数据前,网络负责为在用户间建立一条专用的、端到端(端系统到端系统)的连接,并在组成连接的链路上预留带宽(bandwidth)。当端系统不发送数据时,连接上所预留的带宽就被浪费了。6. 物理介质和接入网络:计算机网络中的通信链路可以有不同的物理介质类型。拨号 (dial-up) 链路、DSL(数字用户线)和绝大多数Ethernet链路由铜芯线组成。有线电视的线缆(cable)链路由同轴电缆组成。长距离的Internet骨干链路一般采用光纤。除了上述有线链路外,还有许多种无线链路,如Wi-Fi(Wireless Fide
8、lity无线高保真)、Bluetooth(蓝牙)、卫星等。接入链路(access link)是将端系统与Internet连接所使用的链路。接入链路可以是铜芯线、同轴电缆、光纤,或者是无线链路。Internet中使用了大量的、各种类型的通信介质。7. 网络的网络:Internet由互相连接的许多网络构成,这些网络通常叫做ISP(Internet Service Provider,Internet服务提供商)。每个ISP都是由分组交换机和通信链路组成的一个网络。因此,Internet就是一个网络的网络(network of networks),并且,构成Internet的ISP通常组织成层次结构。
9、ISP层次结构中低层的ISP叫做接入ISP,包括居住区ISP、大学ISP、企业ISP等。位于ISP层次结构顶层的叫做Tier-1 ISP,通常包括长距离的大洲内和大洲间的光纤链路。Tier-n ISP在收费的基础上为Tier-(n+1) ISP提供服务。ISP间是相互独立的,但是,构成Internet的ISP均采用了叫做Internet Protocol(IP)的公共协议。8. 传输延迟和传播延迟(transmission delay and propagation delay):传输延迟和传播延迟对布式应用系统的性能有着重要的影响。可以通过教材网站上的Java applet例子来更好地理解传
10、输延迟和传播延迟。链路的传播延迟指的是一位数据从链路一端传输到另一个端所耗费的时间,等于链路长度除以信号传播速度(电磁波在非真空介质中的传播速度大于为每秒25万公里)。传输延迟与分组整体有关,而不像传播延迟那样只与位有关系。在给定链路上某个分组的传输延迟等于分组包含的数据位数除以链路的传输速率,也就是从链路上发送分组所需的时间。某一数据位一旦开始从链路上传输,则需要耗费链路传播延迟时间才能到达链路的另一端。因此,分组通过某条链路的总延迟等于传输延迟和传播延迟的和。9. 排队延迟和分组丢失:某一时刻可能有许多分组到达分组交换机,如果这些分组需要从交换机的同一条链路上转发出去,则这些分组中的一个可
11、以进行转发,其他分组需要排队以等待转发。分组在交换机等待转发便引入了排队延迟。此外,如果等待转发的分组数量大得使交换机没有足够的缓存来容纳,分组则会被丢弃,导致分组丢失。排队延迟和分组丢失严重地影响着应用系统的性能。10. 协议层次:计算机网络中使用了多达上百种不同的协议。为了更好地处理这种复杂性,将协议分成了不同的层次,这些协议层次组成了“栈(stack)”。例如,Internet的协议分为五层,从顶向下分别为:应用层、传输层、网络层、链路层和物理层。N层协议使用N-1层协议提供的服务。关于计算机网络协议层次的概念比较抽象,开始时很难把握,随着课程内容的逐步深入将变得越来越清晰。 由于应用层
12、位于协议栈的最高层,可以说协议栈中的其他层都是为应用层提供服务,也确实是这样。因为应用才是计算机网络产生和存在的理由。如果没有网络应用系统,也就无需计算机网络了。11. 封装(Encapsulation):当发送端的应用层协议进程将应用层数据块(消息message)传递给传输层时,消息将作为传输层协议数据单元-segment的有效载荷(payload)。在segment中包含一些传输层的头部信息,如指示接收者将消息传递给哪个应用程序的端口号。从概念上讲,可以将传输层的Segment作为外面写着收件人和发件人地址信息、里面为应用层消息的信件。传输层将segment传递给网络层,整个segment
13、就作为网络层协议数据单元-数据报(datagram)的有效载荷,网络层也在Segment上附加了一些头部信息,如接收方的地址。也可以将Segment作为信瓤,信封为网络层datagram的头部。最终,网络层将datagram交给链路层,作为链路层协议数据单元frame的有效载荷。12. 接收方第n层协议将检查信封外的头部信息。有时,协议可能将信封转交给低层协议(如,向另外一个节点转发),或者打开信封,解析出其中的高层有效载荷,将高层信封交给第n+1层协议。和协议的分层结构一样,关于封装这个概念在开始时也比难以理解。但是,这些技术在我们的教材中通篇都是,必须彻底搞懂他们。复习题(review q
14、uestions)1. Internet中的分组:假设端系统A给端系统B发送一个大文件。从一个比较高的层次描述端系统A如何根据文件创建分组、这些分组中的一个何时到达分组交换机、交换机根据分组中的哪些信息来确定转发分组的输出链路?为什么说分组交换技术类似于在从一个城市到一个城市的沿途不断问路的情况?2. 协议:协议定义两个或多个通信实体间交换消息的格式、顺序、以及收发消息或其他事件发生时采取的动作。描述利用浏览器从Web服务器下载Web页面过程中所使用到的协议(参考教材第7页的图1.2)。3. 电路交换:电路交换中最常采用的复用(multiplexing)技术是什么?4. 电路交换与分组交换:1
15、) 假设所有源端发送数据的速率恒定。此时,采用分组交换技术,还是电路交换技术更合适?为什么?2) 假设所有源端发送数据的突发性很强-即源端偶尔地有数据要发送。此时,采用分组交换技术,还是电路交换技术更合适?为什么?5. 电路交换:假设多个用户共享1Mbps的链路,、每个用户需要的发送速率为500kbps,但是每个用户只在10%的时间里有数据要发送。1) 当采用电路交换技术,该链路最多支持多少个用户?2) 以下各问题中假设采用分组交换技术。为什么只有两个或少数几个用户同时发送数据时基本上没有排队延迟?为什么多个用户同时传输时将存在排队延迟?3) 给出某个用户在任意时刻正在传输数据的概率。4) 假
16、设有三个用户。找出在任意给定时刻三个用户同时发送数据的概率。找出队列不断增长的时间比例。6. 网络的网络:描述Tier-1 ISP的四个特点。7. 网络的网络:讨论Tier-1 ISP之间的经济关系。讨论Tier-1和Tier-2 ISP之间的经济关系。8. 传播延迟:一个长度为1000字节的分组在距离为5000Km的链路上传播,其传播延迟是多大?假设传播速度为2.5X108m/s,链路的传输速率为1Mbps。一般化,如果链路的长度为d公里,传输速率为R bps,传播速率为s米/秒。则长度为L字节分组的传播延迟为多少?传播延迟与分组的长度L有关系吗?传播延迟与链路的传输速率有关系吗?9. 传输
17、延迟:一个长度为1000字节的分组在距离为5000Km的链路上传播,其传输延迟是多大?假设传播速度为2.5X108m/s,链路的传输速率为1Mbps。一般化,如果链路的长度为d公里,传输速率为R bps,传播速率为s米/秒。则长度为L字节的分组的传输播延迟为多少?传输延迟与分组的长度L有关系吗?传输延迟与链路的传输速率有关系吗?10. 传输延迟和传播延迟:假设两台分组交换机之间利用长度为5000Km的链路直接互连,信号传播速度为2.5X108m/s,链路的传输速率为1Mbps。将长度为1000字节的分组从一个交换机传输到另一台交换机需要多长时间?一般化,在长度为d、传播速度为s、传输速率为R
18、bps传输长度为L的分组需要耗费多长时间?11. 多条链路上的延迟:考虑从端系统发送长度为L的分组开始,通过第1条链路到达一台交换机,再经过第2条链路到达目的端系统。设di、Si、Ri分别表示链路i的长度、传播速度和传输速率,其中i=1,2。设分组在交换机中的处理延迟为dproc。假设交换机中没有排队延迟,利用di、Si、Ri和L给出分组经历的端到端延迟。假设L=1000字节,两条链路的传播速度均为2.5X108m/s,传输速率均为1Mbps,交换机的处理延迟为1msec,第一条链路的长度为4000Km,第二条链路的长度为1000Km,计算分组的端到端延迟。12. 存储转发:问题11中,假设R
19、1=R2=R,dproc=0。进一步假设交换机不采用存储转发技术,即不用等待分组完整到达,而是收到1位后立即传输。分组的端到端延迟是多少?13. 排队延迟:交换机收到分组后需要确定分组转发使用的输出链路。当分组到达时,目的输出链路上正在传输另一个分组(假设该分组已经传输了一半),并且队列中还有三个分组正在等待转发。设分组的转发顺序为分组的到达顺序,所有分组的长度均为1000字节,输出链路的传输速率为1Mbps。则该分组的排队延迟是多少?一般化,假设所有分组的长度均为L,链路的传输速率为R,正在传输的分组中的x位已经转发完毕,队列中有N个分组等待转发,则分组的排队延迟是多少?14. 平均排队延迟
20、:假设有N个分组同时到达交换机,且此时交换机队列为空,输出链路上也没有分组正在传输。每个分组的长度为L,输出链路的传输速率为R。则N个分组经历的平均排队延迟是多少?15. 随机到达情况下的排队延迟:考虑传输速率R=1Mbps的链路。假设分组长度L=1250字节,分组以1分组/秒的速率随机到达。令I=La/R表示流量强度。假设某条链路输出端上到达分组所经历的平均排队延迟在I1时可以描述为I/(I-1)*L/R。则分组所经历的平均总延迟为排队延迟加上传输延迟。如果a=30,60,90和99分组/秒时的平均排队延迟和平均总延迟。16. Traceroute:考虑课本第44页的traceroute输出
21、结果。此处,只给出每台路由器的第一个折返延迟(round trip delay),而不是三次折返延迟。请解释为什么有时延迟会下降(一个路由器和接着的下一台路由器)?哪条链路的延迟最大?哪条链路延迟第二大?那些链路在什么位置?17. 电路交换:考虑通过由传输速率均为Rbps的Q条链路组成的路径(path)上发送F位长的分组。假设网络负载很轻,没有排队延迟。同时,忽略传播延迟。1) 假设网络为分组交换的数据报网络,同时采用面向连接的服务类型。每个分组的头部长度为h*F位(0h 24F/R+ts时(或者说当Q16时),分组交换网络中的延迟较大。因此,如果path由超过16条的链路组成,分组交换网络中
22、的延迟将较大,主要原因是存储转发引入的延迟。如果链路数小于16,电路交换网络的延迟较大,原因是电路交换网络的传输速率较低。18. 1)应用层、传输层、网络层、链路层和物理层。2)message、segment、datagram、frame和packet。3)端系统最高处理到应用层。4)路由器最高处理到网络层。5)链路层交换机最高处理到链路层。67Chapter2-Application LayerChapter 2-Application Layer重要概念和思想1. 应用层协议:第一章中我们提到“协议定义两个或多个通信实体(entity)之间所交换数据的格式、顺序,以及在收到/发送消息时/后
23、所采取的动作。”在第二章中会看到在应用层协议中进程如何改善和接收消息。作为回顾,理解下列协议中交换的消息及采取的动作:HTTP, FTP, DNS, SMTP.2. Client/Server versus Peer-to Peer:有两种构造网络应用的方法。分布式应用系统运行在端系统上,通过计算机网络相互交换数据。在客户/服务器范例中(见课本75页),客户进程通过服务器进程发送一个或多个消息来请求一个服务。服务器进程通过读取客户请求、完成一些动作(如,HTTP服务器找到一个Web页),并发送一个或多个应答消息(在HTTP中,返回客户请求的对象)来实现服务。在对等式方法中,协议的两个端系统地位
24、是相等的(像电话业务中的双方一样)。3. Internet传输层提供的两种服务:可靠的、有拥塞控制的数据传输(TCP)和不可靠的数据传输(UDP),这是Internet应用从一个进程向另一个远程进程传输数据的仅有的两种可用的服务。Internet传输层不提供最小传输速率的保证,对从源到目的的延迟也没有限制。4. HTTP:请求/响应的交互。HTTP是一个简单的应用层协议。客户(Web浏览器)用GET消息创建一个请求,Web服务器提供一个应答(见课本89页的图2.6)。这是一个典型的客户/服务器方法。由于HTTP使用TCP来提供GET消息从客户到服务器以及应答消息从服务器到客户的可靠传输,因此必
25、须建立一个TCP连接。一个TCP连接建立请求从客户的TCP发送到服务器的TCP,TCP服务器对TCP客户进行应答。在这个消息交换之后,客户就可以把HTTP GET消息从这个TCP连接上送到服务器,并接收应答(参见课本92页图2.7)。对于非持久的HTTP,客户每次想联系服务器时都必须建立一个新的TCP连接。对于持久的HTTP,多个HTTP GET消息可以从一个TCP连接上传送,因为免去了为每个HTTP请求建立一个新的连接而获得了性能的提升。5. 缓存(Caching):缓存是指将从远程位置返回的请求信息(如Web文档或DNS转换对)保存一个本地的副本,如果有对同一信息的再次请求,就可以直接从本
26、地返回,而无需再从远程位置返回。缓存通过减少响应时间可以改善性能,并避免使用稀少的资源(如课本103页图2.11和104页的图2.12所示的1.5 Mbps访问链路)。思考一下你日常生活中所使用的缓存例如,把一个电话号码写一纸片上并放在衣袋里,而不是再从电话簿上查。6. DNS:用应用层进程实现的核心基础设施。DNS是一个应用层协议。与任何通过服务器向客户提供服务的应用一样,DNS服务器提供名字到IP地址的转换。但DNS服务是非常特殊的网络服务如果没有它网络就不能运行。但它与其它的网络应用的实现方式非常相似。7. FTP:分开控制和数据。学生常问我们为什么要加入FTP这样一个如此“陈旧”的应用
27、。FTP是把控制消息和数据消息分开的一个非常好的例子。如图2.15所示(课本110页),控制和数据消息是在分离的TCP连接上发送的。这种控制与数据的逻辑和物理上的分离可以帮助这样的应用结构更加“清晰”。8. TCPsockets:accept()和建立新的套接字。有关TCP套接字的一个“花招”是当TCP服务从一个系统调用accept()返回时会建立一个新的套接字。当服务器执行accept()时会在一个套接字上等待,我们把这个套接字称为“欢迎套接字”。从accept()返回的套接字用来与通过accept()接连到服务器的客户进行通信。9. UDP sockets:在接收方发送和请求;在接收方数据
28、报来自多个发送方。因为UDP提供了不中靠的数据传送服务,一个通过UDP套接字发送数据报的发送方不知道接收方是否接收到了数据报(除非接收方设计为回送一个数据报来通知原始数据报已收到)。在接收方,来自不同发送方的数据可以在同一个套接字上接收。10. 拉vs.推(Pull versus push)。一个应用进程如何从另一个应用进程获得数据或送数据?在一个拉系统(如Web),数据接收方必须显式地请求(“pull”)信息。在一个推系统中,无需接收方显式地请求数据,数据持有者就会把信息发送给接收者(比如在SMTP中,邮件从发送方被“推”给接收方)。11. 在P2P系统中定位信息。有三种在P2P系统中定位信
29、息的方法:请求泛洪、目录系统和混合系统。现有的P2P系统都是使用这三种方法中的某一种。复习题(review questions)1. 客户-服务器、P2P还是混合的?在课本的2.1.1中讨论了三种应用层体系结构:客户-服务器、P2P以及二者的混合。把下面的场景区分为客户-服务器、P2P、混合结构,并简要解释你的答案。回答这些问题需要一些上网。a. EBayb. Skypec. BitTorrentd. Telnete. DNS2. Internet传输层提供的服务。指出TCP或UDP(或两者兼用或都没有)是否为应用提供了下列的服务:a. 进程间可靠的数据传输服务。b. 进程间最小数据传输速率。
30、c. 进程间数据传输的拥塞控制。d. 保证数据会在指定的时间内送达。e. 保持应用层消息边界。即:当一个发送方通过一个的发送操作把一给字节送入套接字,在接收应用中这一组字节会被当作一组在一个接收操作中被交付。f. 保证数据按序交付给接收方。3. 快速交流。假设你想从一个远程客户与服务器进行尽可能快的交流,你使用UDP还是TCP?4. 使用UDP进行可靠的数据传输。假设你使用UDP从一个远程客户与服务器进行通信。UDP不提供可靠性,但你希望交流请求可以可靠地传给。你应该如何做呢?5. 合时或按顺地传送。假设数据在一个传感器以每秒一个采样的速率输出。接收方传感器读入最近的数据值比读到所有值更重要(
31、例如,接收方得到最近的数值比得到过期的值更好)。你将选择TCP还是UDP来传送传感器的数据?为什么?6. HTTP基础。考虑下面的ASCII码字符串,这是当浏览器发送一个HTTP GET消息(这是一个HTTP GET消息的实际内容)时用Ethereal捕获的。字符表示回车和换行符(即,下文的斜体字符串代表在HTTP头中单独回车符)。回答下列问题,指出你是在下面的HTTP GET 消息的哪里获得的答案。GET /cs453/index.html HTTP/1.1Host: gaia.cs.umass.eduUser-Agent: Mozilla/5.0 (Windows;U; Windows N
32、T 5.1; en-US; rv:1.7.2) Gecko/20040804 Netscape/7.2 (ax) Accept:ext/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5Accept-Language: en-us,en;q=0.5.Accept-Encoding: zip,deflateAccept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7.Keep-Alive: 300Connection:keep-
33、alivea. 浏览器请求的文件的URL是什么?确信你给出了URL的主机名和文件名部分。b. 浏览器运行的HTTP版号是什么?c. 发出请求的浏览器是Netscape 还是 Internet Explorerd. 浏览器请求的是持久性连接还是非持久性连接?e. 浏览器所在的计算机的IP地址是什么?7. 更多的HTTP基础。下面的文本表示服务器对问题6中的HTTP GET请求给出的响应。回答下列问题,并指出你是在下面的消息的哪部分找到的答案。HTTP/1.1 200 OKDate: Tue, 07 Mar 200612:39:45GMT.Server: Apache/2.0.52 (Fedora
34、)Last-Modified: Sat, 10 Dec 2005 18:27:46GMTETag: 526c3-f22-a88a4c80Accept-Ranges: bytesContent-Length: 3874Keep-Alive: timeout=max=100Connection: Keep-AliveContent-Type: text/html; charset=ISO-8859-1 CMPSCI 453 / 591 / NTU-ST550ASpring 2005 homepage a. 服务器是否成功地找到了文件?b. 响应文件提供的时间是什么?c. 文件最近的一次修改是在什么
35、时间?d. 要返回的文件有多少字节?e. 要返回的文件的前5个字节是什么?f. 服务器是否同意持久性连接?8. HTTP性能。在此我们比较非持久性HTTP和持久HTTP,来考虑HTTP的性能。假设你的浏览器要下载100K比特长的页面,并包含10个嵌入的图像(文件名分别 img01.jpg,img02.jpg img10.jpg),每个都是 100K比特长。页面和10个图像都存在同一服务器上,从你的浏览器到服务器具有300毫秒的往返时间(RTT)。你的浏览器与服务器之间的网络路径抽象为一条100Mbps的链路。可以假定传输GET消息的时间为0,但需要计算在链路上传输基本文件和嵌入对象的时间。亦即
36、从服务器到客户的链路即有150毫秒的传播延迟,也有与之关联的传输延迟。(如果你对传播延迟和传输延迟不区别不是很确定,请参阅教材的39页)。你的答案要注意加入建立TCP连接所需要的时间(1RTT)。a. 假定使用非持久性HTTP(并假设在浏览器和服务器之间没在并行的连接打开),响应时间时多长?即从用户请求URL到页面和嵌入的图像都显示出来需要多长时间?注意要描述导致延迟的不同部分。b. 还是假定使用非持久性连接,但现在假设浏览器想打开多少到服务器的并行连接都可以。这种情况下响应时间是多少?c. 现在假设使用持性HTTP(HTTP1.1)。假设不使用流水线,响应时间是多少?d. 现在假设使用流水线的持性HTTP,响应时间是多少?9. 缓存和延迟。考虑下面图中的网络。在网络中有两个用户机器和。假设用户在浏览器URL中键入a. 列出 发送和接收到的DNS和HTTP消息序列,以及从在浏览器中键入URL开始直到接收完文件为止的过程中,任何不是直接发送和接收的出入网络的消息。指出每个消息的源和目的。可以假设HTTP请求首先被送到网络中的HTTP缓存,缓存初始为空,所有的DNS查询都是迭代的查询(iterated queries)。b. 考虑前一个问题中m1.a.co