第六章、应用层
第六章、应用层
Application Layer
编程
在不同的端系统上运行
通过网络基础设施提供的服务,应用进程彼此通信
如Web: Web 服务器软件与浏览器软件通信
网络核心中没有应用层软件
网络核心没有应用层功能
网络应用只在端系统上存在,快速网络应用开发和部署
5.1 Principles of network applications应用层协议原理
网络应用的体系结构
客户-服务器模式(C/S:client/server)
服务器:
一直运行的主机
固定(permanent)的IP地址和周知的端口号(约定)
扩展性:服务器场(server farms for scaling)
- 数据中心进行
- 扩展性差
客户端:
- 主动与服务器通信
- 与互联网有间歇性的连接
- 可能是动态IP 地址
- 不直接与其它客户端通信
对等模式(P2P:Peer To Peer)
(几乎)没有一直运行的服务器
任意(arbitrary)端系统之间可以进行通信
参与的主机间歇性连接且可以改变IP 地址
每一个节点既是客户端又是服务器
- 自扩展性-新peer节点带来新的服务能力,当然也带来新的服务请求(高度可扩展,但难以管理)
混合体:客户-服务器和对等体系结构/
Hybrid of client-server and P2P/
C/S和P2P体系结构的混合体Napster
文件搜索:集中
- 主机在中心服务器上注册其资源
- 主机向中心服务器查询资源位置
文件传输:P2P
- 任意Peer节点之间
即时通信
在线检测:集中Presence detection/location centralized
- 当用户上线时,向中心服务器注册其IP地址
- 用户与中心服务器联系,以找到其在线好友的位置
两个用户之间聊天:P2P
进程通信(Processes communicating)
进程:在主机上运行的应用程序
在同一个主机内,使用进程间通信机制通信(操作系统定义)
不同主机,通过交换报文(Message)来通信
使用OS提供的通信服务
按照应用协议交换报文
- 借助传输层提供的服务
Sockets套接字
进程向套接字发送报文或从套接字接收报文
套接字 <(类比analogous)-> 门户
- 发送进程将报文推出门户,发送进程依赖于传输层设施在另外一侧的门将报文交付给接受进程
- 接收进程从另外一端的门户收到报文(依赖于传输层设施)
API:(1)传输协议的选择;(2)修复一些参数的能力(稍后会详细介绍)
寻址流程Addressing processes
对于要接收消息的进程,它必须具有标识符(identifier)
主机具有唯一的 32 位 IP 地址
问:运行进程的主机的 IP 地址是否足以识别进程?
答:不可以,许多进程可以在同一主机上运行
标识符包括与主机上的进程关联的 IP 地址和端口号。
端口号示例:
- 网络版服务器: 80
邮件服务器: 25
- 网络版服务器: 80
应用层协议定义运行在不同端系统上
的应用进程如何相互交换报文
交换的报文类型:如请求和应答报文
各种报文类型的语法(syntax):报文中的各个字段及其描述(delineate)
字段的语义(semantics):即字段取值的含义
进程何时、如何发送报文及对报文进行响应的规则
公开协议(Public-domain protocols):
由RFC文档定义
允许互操作
- 如HTTP, SMTP
专用(私有)协议(Proprietary protocols):协议不公开
- 如:Skype
应用需要传输层提供什么样的服务?
数据丢失率Data loss
- 有些应用则要求100%的可靠数据传输(如文件)
- 有些应用(如音频)能容忍一定比例以下的数据丢失
吞吐Bandwidth
- 一些应用(如多媒体)必须需要最小限度的吞吐,从而使得应用能够有效运转
- 一些应用能充分利用可供使用的吞吐(弹性应用)
延迟Timing
一些应用出于有效性考虑,对数据传输有严格的时间限制
- Internet 电话、交互式游戏
- 延迟、延迟差
安全性(扩展B)
- 机密性
- 完整性
- 可认证性(鉴别)
常见应用对传输服务的要求
Internet 传输层提供的服务
TCP 服务:
- 面向连接connection-oriented:要求在客户端进程和服务器进程之间建立连接
- 流量控制flow control:发送方不会淹没(overwhelm)接受方
- 拥塞控制congestion control:当网络出现拥塞时,能抑制发送方
- 不能提供的服务:时间保证、最小吞吐保证和安全
- 可靠的传输服务reliable transport
UDP 服务:不可靠数据传输
不提供的服务:可靠,流量控制、拥塞控制、时间、带宽保证、建立连接
UDP存在的必要性
能够区分不同的进程,而IP服务不能
在IP提供的主机到主机端到端功能的基础上,区分了主机的应用进程
无需建立连接,省去了建立连接时间,适合事务性的应用
不做可靠性的工作,例如检错重发,适合那些对实时性要求比较高而对正确性要求不高的应用
因为为了实现可靠性(准确性、保序等),必须付出时间代 价(检错重发)
没有拥塞控制和流量控制,应用能够按照设定的速度发送数据
而在TCP上面的应用,应用发送数据的速度和主机向网络发送的实际速度是不一致的,因为有流量控制和拥塞控制
Internet应用及其应用层协议和传输协议
5.2 Web and HTTP
一些术语
Web页(Web page):由一些对象组成
- 对象可以是HTML文件、JPEG图像、Java小程序、声音剪辑文件等
- Web页含有一个基本的HTML文件,该基本HTML文件又包含若干对象的引用(链接)
通过URL对每个对象进行引用(addressable)
- 访问协议,用户名,口令字,端口等;
URL格式:
HTTP概况
HTTP: 超文本传输协议(hypertext transfer protocol)
- Web的应用层协议
- 客户/服务器模式 (client/server model)
- 客户端: 请求、接收和显示Web对象的浏览器(browser)
- 服务器: 对请求进行响应,发送对象的Web服务器
- HTTP 1.0: RFC 1945
HTTP 1.1: RFC 2068
使用TCP:
- 客户发起一个与服务器的TCP连接 (建立套接字) ,端口号为 80
- 服务器接受客户端的TCP连接
- 在浏览器(HTTP客户端)与 Web服务器(HTTP服务器 server)交换HTTP报文 (应用层协议报文)
- TCP连接关闭
HTTP是无状态(stateless)的
服务器并不维护关于客户的任何信息
注:维护状态的协议很复杂!
必须维护历史信息(状态)
如果服务器/客户端死机(crashes),它们的状态信息可能不一致(inconsistent),二者的信息必须进行协调(reconciled)
无状态的服务器能够支持更多的客户端
两种类型的HTTP报文:请求request、响应response
HTTP请求报文
- HTTP请求报文:ASCII (人能阅读)
HTTP响应报文
用户-服务器状态User-server state: cookies
大多数主要的门户网站(web sites)使用 cookies
4个组成部分:
- 在HTTP响应报文中有一个cookie的首部行
- 2)在HTTP请求报文含有一个cookie的首部行
- 在用户端系统中保留有一个cookie文件,由用户的浏览器(browser)管理
- 在Web站点(Sites)有一个后端(back-edn)数据库
一个栗子
Susan总是用同一个PC使用Internet Explore上网
她第一次访问了一个使用了Cookie的电子商务网站
当最初的HTTP请求到达服务器时,该Web站点产生一个唯一ID,并以此作为索引在它的后 端数据库中产生一个项
Web缓存caches (代理服务器proxy server)
目标:不访问原始服务器,就满足客户的请求
用户设置浏览器: 通过缓存(cache)访问Web
浏览器将所有的HTTP请求发给缓存
- 在缓存中的对象:缓存直接返回对象
- 如对象不在缓存,缓存请求原始服务器,然后再将对象返回给客户端
5.3 FTP 文件传输协议(file transfer protocol)
向远程主机上传输文件或从远程主机接收文件
客户/服务器模式
- 客户端:发起传输的一方
- 服务器:远程主机
ftp: RFC 959
ftp服务器:端口号为21
FTP: 控制连接与数据连接分开
- FTP客户端与FTP服务器通过端口21联系,并指定(specifying)TCP为传输协议
- 客户端通过控制连接获得身份确认(authorization)
- 客户端通过控制连接发送命令浏览远程目录(remote directory)
- 收到一个文件传输命令时,服务器打开一个到客户端的数据连接
- 一个文件传输完成后,服务器关闭连接
- 服务器打开第二个TCP数据连接用来传输另一个文件
- 控制连接: 带外( “out of band”)传送
- FTP服务器维护用户的状态信息:当前路径、用户帐户与控制连接对应
- 有状态
FTP命令、响应
命令commands样例:
- 在控制连接上以ASCII文本方式传送
sent as ASCII text over control channel - USER username
- PASS password
- LIST:请服务器返回远程主机当前目录的文件列表
- RETR filename:从远程主机的当前目录检索文件(gets)
- STOR filename:向远程主机的当前目录存放文件(puts)
- 在控制连接上以ASCII文本方式传送
返回码return codes样例:
- 状态码和状态信息(status code and phrase) (同HTTP)
- 331 Username OK, password required
- 125 data connection already open; transfer starting
- 425 Can’t open data connection
- 452 Error writing file
5.4 Electronic Mail
(SMTP, POP3, IMAP)
Electronic Mail3个主要组成部分:
用户代理user agents
- 又名 “邮件阅读器mail reader”
- 撰写、编辑和阅读邮件(composing, editing, reading mail messages)
- 如., Eudora, Outlook, elm, Netscape Messenger、Foxmail
- 输出和输入(outgoing, incoming)邮件保存在服务器上
邮件服务器mail servers
邮箱(mailbox)中管理和维护发送给用户的邮件
输出(outgoing)报文队列(message queue)保持待发送邮件报文
邮件服务器之间的SMTP协议:发送email报文
- 客户:发送方邮件服务器
- 服务器:接收端邮件服务器
简单邮件传输协议:SMTP[RFC 2821]
使用TCP在客户端和服务器之间可靠传送报文,端口号为25
直接传输:从发送方服务器到接收方服务器
传输的3个阶段
- 握手handshaking (greeting)
- 传输报文transfer of messages
- 关闭closure
命令/响应交互
- 命令commands:ASCII文本
- 响应response:状态码和状态信息
报文必须为7位ASCII码
一个栗子
- Alice使用用户代理撰写邮件并发送给 bob@someschool.edu 2) Alice的用户代理将邮件发送到她的邮件服务器;邮件放在报文队列中
- SMTP的客户端打开到Bob邮件服务器的TCP连接
- SMTP客户端通过TCP连接发送Alice的邮件
- Bob的邮件服务器将邮件放到 Bob的邮箱
- Bob调用他的用户代理阅读邮件
简单的SMTP交互
S: 220 hamburger.edu
C: HELO crepes.fr
S: 250 Hello crepes.fr, pleased to meet you
C: MAIL FROM:
S: 250 alice@crepes.fr… Sender ok
C: RCPT TO: S: 250 bob@hamburger.edu … Recipient ok
C: DATA
S: 354 Enter mail, end with “.” on a line by itself
C: Do you like ketchup?
C: How about pickles?
C: .
S: 250 Message accepted for delivery
C: QUIT
S: 221 hamburger.edu closing connection尝试SMTP交互
- telnet servername 25
- see 220 reply from server
- enter HELO, MAIL FROM, RCPT TO, DATA, QUIT commands
- 上面允许您在不使用电子邮件客户端(阅读器)的情况下发送电子邮件
总结:
SMTP使用持久连接
SMTP要求报文(首部和主体)为7位ASCII编码
SMTP服务器使用CRLF.CRLF决定报文的尾部HTTP比较:
- HTTP:拉(pull)
SMTP:推(push)
二者都是ASCII形式的命令/响应交互、状态码
HTTP:每个对象封装在各自的响应报文中
SMTP:多个对象包含在一个报文中
- HTTP:拉(pull)
邮件报文格式Mail message format
报文格式:多媒体扩展 multimedia extensions
- MIME:多媒体邮件扩展(multimedia mail extension), RFC 2045, 2056
- 在报文首部用额外的行申明MIME内容类型
邮件访问协议Mail access protocols
SMTP: 传送到接收方的邮件服务器
邮件访问协议:从服务器检索(retrieval)邮件
POP:邮局访问协议(Post Office Protocol)[RFC 1939]
- 授权authorization (代理<–>服务器) 并下载
IMAP:Internet邮件访问协议(Internet Mail Access Protocol)[RFC 1730] (更多特性 (更复杂))
在服务器上处理存储的报文(远程管理文件夹)
IMAP服务器将每个报文与一个文件夹联系起来
允许用户用目录来组织报文
允许用户读取报文组件
IMAP在会话过程中保留用户状态:
- 目录名、报文ID与目录名之间映射
HTTP:Hotmail , Yahoo! Mail等
- 方便
POP3协议
- (本地管理文件夹)
- 先前的例子使用 “下载并删除”模式。
(如果改变客户机,Bob不能阅读邮件) - “下载并保留”:不同客户机上为报文的拷贝
- POP3在会话中是无状态的
5.5 DNS(Domain Name System)域名系统
互联网主机、路由器:
- IP 地址(32 位) - 用于寻址数据报
- “名称”,例如,ww.yahoo.com - 由人类使用
DNS域名系统:
分布式数据库distributed database :在多个名称服务器的层次结构中实现
应用层协议application-layer protocol:主机、路由器、名称服务器,用于通信以解析(resolve)名称(地址/名称转换)
- 注:核心互联网功能,作为应用层协议实现
- 网络“边缘”的复杂性
DNS的服务
主机名到 IP 地址的转换
主机别名Host aliasing
- 规范名称和别名Canonical and alias names
邮件服务器别名(aliasing)
负载分布Load distribution
- 复制的(Replicated)Web 服务器:一个规范名称的 IP 地址集
为什么不集中化 DNS?
- 单点故障single point of failure
- 流量traffic volume
- 远程集中式数据库distant centralized database
- 维护maintenance
分布式分层数据库
Distributed, Hierarchical Database
DNS: Root name servers
无法解析名称的本地名称服务器联系
根名称服务器:
- 如果名称映射未知,则联系权威名称服务器(authoritative name serve)
- 获取映射mapping
- 返回到本地名称服务器的映射
TLD and Authoritative Servers(TLD服务器和权威服务器)
顶级域服务器(Top-level domain ,TLD servers):负责顶级域名(如com,org, net,edu和gov)和所有国家级的顶级名(如cn, uk, fr, ca,jp )
- Network solutions 公司维护com TLD服务器
- Educause公司维护edu TLD服务器
Authoritative DNS servers组织的 DNS 服务器,为组织的服务器(例如 Web 和邮件)提供 IP 映射的权威主机名。
- 可由组织或服务提供商维护
本地名字服务器(Local Name Server)
- 并不严格属于层次结构
- 每个ISP (居民区的ISP、公司、大学)都有一个本地DNS服务器
- 也称为“默认名字服务器”
- 当一个主机发起一个DNS查询时,查询被送到其本地DNS服务器
- 起着代理的作用,将查询转发到层次结构中
一个栗子:cis.poly.edu 的主机需要 gaia.cs.umass.edu 的 IP 地址
递归查询recursive query(根服务器的负担太重)
- 名字解析负担都放在当前联络的名字服务器上
迭代查询iterated query
- 已联系的服务器回复要联系的服务器的名称
- “我不知道这个名字,但问这个服务器”
5.6 P2P file sharing(P2P应用)
5.7 Socket programming with TCP(TCP套接字编程)
5.8 Socket programming with UDP(UDP套接字编程)
5.9 Building a Web server
因为知识点很多,这部分的笔记最开始是用思维导图记的,但是图片都不能导出,xmind格式的到百度网盘自行下载或者联系我私发叭,笔记效果如下(也不是那么好看,建议还是看PPT或者自己整理效率较高,我的笔记整理效果稍稍欠缺):