Linux内核分析网络五网桥.docx
- 文档编号:5150982
- 上传时间:2022-12-13
- 格式:DOCX
- 页数:9
- 大小:76.96KB
Linux内核分析网络五网桥.docx
《Linux内核分析网络五网桥.docx》由会员分享,可在线阅读,更多相关《Linux内核分析网络五网桥.docx(9页珍藏版)》请在冰豆网上搜索。
Linux内核分析网络五网桥
看完了路由表,重新回到netif_receive_skb()函数,在提交给上层协议处理前,会执行下面一句,这就是网桥的相关操作,也是这篇要讲解的内容。
viewplaincopytoclipboardprint?
1.skb = handle_bridge(skb, &pt_prev, &ret, orig_dev);
skb=handle_bridge(skb,&pt_prev,&ret,orig_dev);
网桥可以简单理解为交换机,以下图为例,一台linux机器可以看作网桥和路由的结合,网桥将物理上的两个局域网LAN1、LAN2当作一个局域网处理,路由连接了两个子网1.0和2.0。
从eth0和eth1网卡收到的报文在Bridge模块中会被处理成是由Bridge收到的,因此Bridge也相当于一个虚拟网卡。
STP五种状态
DISABLED
BLOCKING
LISTENING
LEARNING
FORWARDING
创建新的网桥br_add_bridge[net\bridge\br_if.c]
当使用SIOCBRADDBR调用ioctl时,会创建新的网桥br_add_bridge。
首先是创建新的网桥:
viewplaincopytoclipboardprint?
1.dev = new_bridge_dev(net, name);
dev=new_bridge_dev(net,name);
然后设置dev->dev.type为br_type,而br_type是个全局变量,只初始化了一个名字变量
viewplaincopytoclipboardprint?
1.SET_NETDEV_DEVTYPE(dev, &br_type);
2.static struct device_type br_type = {
3. .name = "bridge",
4.};
SET_NETDEV_DEVTYPE(dev,&br_type);
staticstructdevice_typebr_type={
.name="bridge",
};
然后注册新创建的设备dev,网桥就相当一个虚拟网卡设备,注册过的设备用ifconfig就可查看到:
viewplaincopytoclipboardprint?
1.ret = register_netdevice(dev);
ret=register_netdevice(dev);
最后在sysfs文件系统中也创建相应项,便于查看和管理:
viewplaincopytoclipboardprint?
1.ret = br_sysfs_addbr(dev);
ret=br_sysfs_addbr(dev);
将端口加入网桥br_add_if()[net\bridge\br_if.c]
当使用SIOCBRADDIF调用ioctl时,会向网卡加入新的端口br_add_if。
创建新的net_bridge_portp,会从br->port_list中分配一个未用的port_no,p->br会指向br,p->state设为BR_STATE_DISABLED。
这里的p实际代表的就是网卡设备。
viewplaincopytoclipboardprint?
1.p = new_nbp(br, dev);
p=new_nbp(br,dev);
将新创建的p加入CAM表中,CAM表是用来记录mac地址与物理端口的对应关系;而刚刚创建了p,因此也要加入CAM表中,并且该表项应是local的[关系如下图],可以看到,CAM表在实现中作为net_bridge的hash表,以addr作为hash值,链入net_bridge_fdb_entry,再由它的dst指向net_bridge_port。
viewplaincopytoclipboardprint?
1.err = br_fdb_insert(br, p, dev->dev_addr);
err=br_fdb_insert(br,p,dev->dev_addr);
设备的br_port指向p。
这里要明白的是,net_bridge可以看作全局量,是网桥,而net_bridge_port则是与网卡相对应的端口,因此每个设备dev有个指针br_port指向该端口。
viewplaincopytoclipboardprint?
1.rcu_assign_pointer(dev->br_port, p);
rcu_assign_pointer(dev->br_port,p);
将新创建的net_bridge_port加入br的链表port_list中,在创建新的net_bridge_port时,会分配一个未用的port_no,而这个port_no就是根据br->port_list中的已经添加的net_bridge_port来找到未用的port_no的[具体如下图]。
viewplaincopytoclipboardprint?
1.list_add_rcu(&p->list, &br->port_list);
list_add_rcu(&p->list,&br->port_list);
重新计算网桥的ID,这里根据br->port_list链表中的net_bridge_port的最小的addr来作为网桥的ID。
viewplaincopytoclipboardprint?
1.br_stp_recalculate_bridge_id(br);
br_stp_recalculate_bridge_id(br);
网卡设备的删除br_del_bridge()与端口的移除add_del_if()与添加差不多,不再详述。
熟悉了网桥的创建与添加,再来看下网桥是如何工作的。
当收到数据包,通过netif_receive_skb()->handle_bridge()处理网桥:
viewplaincopytoclipboardprint?
1.static inline struct sk_buff *handle_bridge(struct sk_buff *skb,
2. struct packet_type **pt_prev, int *ret,
3. struct net_device *orig_dev)
4.{
5. struct net_bridge_port *port;
6.
7. if (skb->pkt_type == PACKET_LOOPBACK ||
8. (port = rcu_dereference(skb->dev->br_port)) == NULL)
9. return skb;
10.
11. if (*pt_prev) {
12. *ret = deliver_skb(skb, *pt_prev, orig_dev);
13. *pt_prev = NULL;
14. }
15.
16. return br_handle_frame_hook(port, skb);
17.}
staticinlinestructsk_buff*handle_bridge(structsk_buff*skb,
structpacket_type**pt_prev,int*ret,
structnet_device*orig_dev)
{
structnet_bridge_port*port;
if(skb->pkt_type==PACKET_LOOPBACK||
(port=rcu_dereference(skb->dev->br_port))==NULL)
returnskb;
if(*pt_prev){
*ret=deliver_skb(skb,*pt_prev,orig_dev);
*pt_prev=NULL;
}
returnbr_handle_frame_hook(port,skb);
}
1. 如果报文来自lo设备,或者dev->br_port为空(skb->dev是收到报文的网卡设备,而在向网桥添加端口时,dev->br_port被赋予了创建的与网卡相对应的端口p),此时不需要网桥处理,直接返回报文;
2. 如果报文匹配了之前的ptype_all中的协议,则pt_prev不为空,此时要先进行ptype_all中协议的处理,再进行网桥的处理;
3. br_handle_frame_hook是网桥处理钩子函数,在br_init()[net\bridge\br.c]中
br_handle_frame_hook=br_handle_frame;
br_handle_frame()[net\bridge\br_input.c]是真正的网桥处理函数,
下面进入br_handle_frame()开始网桥部分的处理:
与前面802.1q讲的一样,首先检查users来决定是否复制报文:
viewplaincopytoclipboardprint?
1.skb = skb_share_check(skb, GFP_ATOMIC);
skb=skb_share_check(skb,GFP_ATOMIC);
如果报文的目的地址是01:
80:
c2:
00:
00:
0X,则是发往STP的多播地址,此时调用br_handle_local_finish()来完成报文的进一步处理:
viewplaincopytoclipboardprint?
1.if (unlikely(is_link_local(dest))){
2.……
3.if (NF_HOOK(PF_BRIDGE, NF_BR_LOCAL_IN, skb, skb->dev,
4. NULL, br_handle_local_finish))
5. return NULL; /* frame consumed by filter */
6. else
7. return skb;
8.}
if(unlikely(is_link_local(dest))){
……
if(NF_HOOK(PF_BRIDGE,NF_BR_LOCAL_IN,skb,skb->dev,
NULL,br_handle_local_finish))
returnNULL;/*frameconsumedbyfilter*/
else
returnskb;
}
而br_handle_local_finish()所做的内容很简单,因为是多播报文,主机要做的仅仅是更新报文的源mac与接收端口的关系(在CAM表中)。
viewplaincopytoclipboardprint?
1.static int br_handle_local_finish(struct sk_buff *skb)
2.{
3. struct net_bridge_port *p = rcu_dereference(skb->dev->br_port);
4.
5. if (p)
6. br_fdb_update(p->br, p, eth_hdr(skb)->h_source);
7. return 0; /* process further */
8.}
staticintbr_handle_local_finish(structsk_buff*skb)
{
structnet_bridge_port*p=rcu_dereference(skb->dev->br_port);
if(p)
br_fdb_update(p->br,p,eth_hdr(skb)->h_source);
return0;/*processfurther*/
}
接着br_handle_frame()继续往下看,然后根据端口的状态来处理报文,如果端口state=BR_STATE_FORWARDING且设置了br_should_route_hook,则转发后返回skb;否则继续往下执行state=BR_STATE_LEARNING段的代码:
viewplaincopytoclipboardprint?
1.rhook = rcu_dereference(br_should_route_hook);
2.if (rhook !
= NULL) {
3. if (rhook(skb))
4. return skb;
5. dest = eth_hdr(skb)->h_dest;
6.}
rhook=rcu_dereference(br_should_route_hook);
if(rhook!
=NULL){
if(rhook(skb))
returnskb;
dest=eth_hdr(skb)->h_dest;
}
如果端口state=BR_STATE_LEARNING,如果是发往本机的报文,则设置pkt_type为PACKET_HOST,然后执行br_handle_frame_finish来完成报文的进一步处理。
要注意的是,这里将报文发往本机的报文设为PACKET_HOST,实现了经过网桥处理后,再次进入netif_receive_skb()时,不会再被网桥处理(结果进入网桥的条件理解):
viewplaincopytoclipboardprint?
1.if (!
compare_ether_addr(p->br->dev->dev_addr, dest))
2. skb->pkt_type = PACKET_HOST;
3.NF_HOOK(PF_BRIDGE, NF_BR_PRE_ROUTING, skb, skb->dev, NULL,
4. br_handle_frame_finish);
if(!
compare_ether_addr(p->br->dev->dev_addr,dest))
skb->pkt_type=PACKET_HOST;
NF_HOOK(PF_BRIDGE,NF_BR_PRE_ROUTING,skb,skb->dev,NULL,
br_handle_frame_finish);
除此之外,端口处于不可用状态,此时丢弃掉报文:
viewplaincopytoclipboardprint?
1.kfree_skb(skb);
kfree_skb(skb);
下面来详细看下br_handle_frame_finish()函数。
首先还是会根据收到报文的源mac和端口更新CAM表,这是交换机区别于hub的重要特征:
viewplaincopytoclipboardprint?
1.br_fdb_update(br, p, eth_hdr(skb)->h_source);
br_fdb_update(br,p,eth_hdr(skb)->h_source);
然后如果端口处于LEARNING状态,则只是学习到CAM表中,而不对报文作任何处理,所以丢弃掉报文:
viewplaincopytoclipboardprint?
1.if (p->state == BR_STATE_LEARNING)
2. goto drop;
if(p->state==BR_STATE_LEARNING)
gotodrop;
否则端口已处于FORWARDING状态,此时分情况:
1. 如果报文是多播的,则br_flood_forward(br,skb,skb2);
2. 如果报文是单播的,但不在网桥的CAM表中,则br_flood_forward(br,skb,skb2);
3. 如果报文是单播的,在网桥的CAM表中,但不是发往本机,则br_forward(dst->dst,skb,skb2);
4. 如果报文是单播的,在网桥的CAM表中,且是发往本机,则br_pass_frame_upbr_pass_frame_up(skb2);
br_handle_frame_finish()处理完后,顺着最后一种情况继续往下走,br_pass_frame_up()。
该函数比较简单,我们知道,在底层报文的向上传递就是通过设备的更换来进行的(参考802.1q),这里将skb的设备换成网桥设备,使上层协议不知道报文来自网卡,而是认为报文来自于网桥;然后调用netif_receive_skb()再次进入接收栈:
viewplaincopytoclipboardprint?
1.skb->dev = brdev;
2.return NF_HOOK(PF_BRIDGE, NF_BR_LOCAL_IN, skb, indev, NULL,
3. netif_receive_skb);
skb->dev=brdev;
returnNF_HOOK(PF_BRIDGE,NF_BR_LOCAL_IN,skb,indev,NULL,
netif_receive_skb);
经过网桥处理后,再次进入netif_receive_skb()->handle_bridge(),此时skb->dev已经不是网卡设备了,而是网桥设备,注意到在向网桥添加端口时,是相应网卡dev->br_port赋值为创建的端口,网桥设备是没有的,因此其br_port为空,在这一句会直接返回,进入正常的协议栈流程:
viewplaincopytoclipboardprint?
1.if (skb->pkt_type == PACKET_LOOPBACK ||
2. (port = rcu_dereference(skb->dev->br_port)) == NULL)
3. return skb;
if(skb->pkt_type==PACKET_LOOPBACK||
(port=rcu_dereference(skb->dev->br_port))==NULL)
returnskb;
当发送数据报文时,会调用br_dev_xmit()[net\bridge\br_device.c],大致会根据目的地址调用br_multicast_deliver()或br_flood_deliver()或br_deliver(),在其过程中会将skb->dev由原来的网桥设备brdev换面网卡设备dev,然后通过网卡变更向下传递报文;
内核协议栈中,发送与接收是分离的,接收像是报文脱壳的过程,发送则是函数的嵌套调用。
有关发送的流程,稍后专门详述。
如有侵权请联系告知删除,感谢你们的配合!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Linux内核分析 网络五网桥 Linux 内核 分析 网络 五网桥