作者介绍:杨秀璋
自幼受贵州大山的熏陶,养成了诚实质朴的性格。经过寒窗苦读,考入BIT,为完成自己的教师梦,放弃IT、航天等工作,成为贵财一名大学教师,并想把自己所学所感真心传授给自己的学生,帮助更多陌生人。
一.Wireshark抓包原理
(一).网络抓包原理
网络中不论传输什么,最终通过物理介质发送的都是二进制,类似于0101的Bit流。纯文本(字符串)中文通常采用UTF-8编码,英文用ASCII编码;非纯文本音频、视频、图片、压缩包等按不同编码封装好,转换成二进制传输。在IP网络中,通过Wireshark抓包,获取的原始数据都是二进制。
哪种网络情况下能够抓取到包呢?下面结合网络原理讲解。网络抓包主要存在三种情况:本机环境、集线器环境和交换机环境。
1.本机环境
本机环境直接抓包本机网卡进出的流量。Wireshark会绑定我们的网卡,不需要借助第三方设备(交换机、集线路由器)就能抓取我们的网络通信流量,这是最基本的抓包方式。
2.集线器环境
集线器环境可以做流量防洪,同一冲突域。集线器的英文是“Hub”,“Hub”是“中心”的意思,集线器的主要功能是对接收到的信号进行再生整形放大,以扩大网络的传输距离,同时把所有节点集中在以它为中心的节点上。它工作于OSI参考模型第一层,即“物理层”。
假设三台电脑通信,PC1处安装Wireshark,当PC2、PC3发送数据包到集线器网络里面(冲突域或广播域),由于集线器是物理层产品,不能识别MAC地址、IP地址,它会将接收包往其他所有接口泛洪,此时Wireshark就能抓到从同一个集线器其他电脑发过来的数据包,即局域网中的数据包。这是一种典型的老网络做法,现在基本淘汰。
3.交换机环境
交换机环境是更加常见的方式,包括端口镜像、ARP欺骗、MAC泛洪。
(1)端口镜像
交换机是一种数据链路层甚至网络层的产品,它的转包接包严格按照交换机上的MAC地址表通信。所以正常情况下,PC2和PC3通信流量是很难流到PC1的网卡上。当PC2和PC3通信时,PC1是无法通过Wireshark抓到包。但是我们可以在交换机端口做SAPN端口镜像操作,它会将其他两个口的流量复制一份到PC1处,PC1的网卡和Wireshark设置为混插模式,此时就能进行抓包。该模式常用于很多付费的流量分析软件。
(2)ARP劫持
假设我们没有权限在交换机上做端口镜像技术,因为有MAC地址表,又想获取整个局域网中的流量,窃取到PC2、PC3上的流量。这可以通过著名的ARP攻击软件Cain&Abel实现,其流程是:
首先,PC2发送ARP请求广播包,交换机收到包之后会发给PC1和PC3。
PC1和PC3接收到,正常情况下PC1会丢弃该包,因为询问的是PC3,但ARP欺骗会回复“我是IP3,对应地址为MAC1”,这就是典型的ARP欺骗或ARP病毒。
最后PC2会将流量封装成底层的MAC1回复过去。如果PC3和PC1都回应,但APR有个特性叫后到优先,PC1会做一个错误的绑定,将数据包发到MAC1,从而导致PC2和PC3的通信流量都会经过PC1,这也是典型的流量劫持、局域网攻击。
3)MAC泛洪 通过工具泛洪带来大量垃圾包,产生大量MAC地址,此时交换机MAC地址表会变为右边这张表(爆表),MAC2和MAC3被挤出了MAC地址表。一旦这种MAC地址被挤出MAC地址表,按照交换机原理,如果收到的数据包是未知,它会对外泛洪,此时PC2和PC3对外流量泛洪。
(二).底层框架原理
那么,抓包的底层架构是怎样的?下面开始讲解Wireshark的底层原理。
Wireshark包括5层架构:
最底层Win-/libpcap:Wireshark抓包时依赖的库文件(驱动文件、库文件)
Capture:抓包引擎,利用libpcap/WinPcap底层抓取网络数据包,libpcap/WinPcap提供了通用的抓包接口,能从不同类型的网络接口(包括以太网、令牌环网、ATM网等)获取数据包
Wiretap:此时获取的是一些比特流,通过Wiretap(格式支持引擎)能从抓包文件中读取数据包,支持多种文件格式
Core:核心引擎,通过函数调用将其他模块连接在一起,起到联动调用的作用,包分析引擎涉及Protocol-Tree(保存数据包的协议信息,协议结构采用树形结构,解析协议报文时只需从根节点通过函数句柄依次调用各层解析函数即可)、Dissectors(各种协议解码器,支持700多种协议解析,解码器能识别出协议字段,并显示出字段值,Wireshark采用协议树的形式对数据流量的各层次协议逐层处理)、Plugins(一些协议解码器以插件形式实现,源码在plugins目录)、Display-Filters(显示过滤引擎,源码在epan/dfilter目录)。
GTK1/2:图形处理工具,处理用户的输入输出显示,最终存储至Harddisk硬盘中。
PS:了解基本的原理知识挺重要的,尤其为后续
深入的研究。
二.界面功能介绍
Wireshark运行后,其界面如下图所示,包括标题栏、菜单栏、工具栏、数据包过滤栏、数据包列表区、数据包详细区、数据包字节区、数据包统计区。
从上下按序编号如下图所示。
下面简单介绍一些界面常识。
2.数据包详细区用得最多,它是解析数据包核心区域。数据包包含时间流、谁发给谁(原始IP地址和目的IP地址)、协议、长度、内容等,当双击它能看到对应的详细信息。
数据包详细区、数据包字节区包含比特字节信息。
3.统计栏的内容也值得大家去深入学习,后面会分享流量图信息。
4.显示界面中可以设置字体大小,如下图所示。
5.列设置包括默认列表、增加列、修改列、隐藏列、删除列,设置默认即可,下图是选中某行右键“应用为列”即可增加列。
增加后如下图所示:
选中该列名称,右键“删除列”即可。点击“编辑列”可以对名称进行修改。
6.时间设置涉及时间格式和参考时间。
修改之后如下图所示,不在显示时间间隔。
7.名字解析主要用于判断厂商信息,名词解析库,基本知识如下图所示。
设备相关信息如下图所示:
8.开启传输域名解析。
开启之后可以看到解析的域名(domain)及对应的DNS。
9.查看解析地址。
显示结果如下:
10.数据包操作包括数据包标记、注释数据包、合并数据包、打印数据包、导出数据包,通过不同的协议设置不同的配色方案。
如下图所示修改为红色。
11.文件->打印。
接下来作者将继续分享Wireshark的实际案例知识,首先讲解数据流追踪、专家信息获取和统计摘要获取的知识。
三.数据流追踪和专家统计说明
1.数据流追踪
数据流追踪主要是将TCP、UDP、SSL数据流进行重组并完整呈现出来,其点击路径为:Analyze -> Follow -> TCP stream 分析。跟踪TCP流实现如下图所示:
我们在访问网页的时候,除了HTTP协议,大部分的流量应该是通过TCP协议生成数据包的,如下图所示。红色部分表示浏览器访问的网址信息(Request),蓝色部分表示对方给我们的反馈信息(Response)。
2.专家信息说明 其功能是对数据包中特定状态进行警告说明,包括错误(errors)、警告(warnings)、注意(notes)、对话(chats)。正常通信是不会丢包的,但实际情况可能有延迟,可以通过专家信息分析和查看网站的稳定性。
显示结果如下图所示,并被标注为各种颜色。
3.统计摘要说明
其功能主要是对抓取的数据包进行全局统计,基本点击路径为:Statistics -> Summary 统计汇总信息。显示结果如下图所示,后续可能会结合案例详细讲解。
四.Wireshark和NetworkMiner劫持流量及图片
NetworkMiner:一款开源的网络取证和协议分析工具,能够通过嗅探器检测操作系统、主机名以及开放的端口。同时也可以通过分析pcap文件来获取到数据包的详细信息。除了能够进行基本的数据包抓取分析,NetworkMiner还支持以下功能:
以节点形式展示针对某个主机的通讯信息。
可以通过数据包详细信息查看主机的IP地址、端口、使用协议以及服务器版本、数据包大小等。
可以设置以IP地址或者主机名或者操作系统等其他类别显示数据包。
可以自动通过数据包分析出里面的文件,例如图片、js以及css等其他传输的文件。
可以分析出数据包中的证书信息。
可以分析出http协议中的Session信息和cookie以及其他参数。
支持根据关键词查找功能,支持对FTP、TFTP、HTTP、SMB 和 SMTP协议的文件提取。
总之,这个源码项目还是比较复杂的,如果想深入研究数据包结构分析和Pcap,NetworkMiner也是个不错的选择。
下面结合Wireshark和NetworkMiner工具讲解劫持流量案例,获取登录HTTP网站的用户名和密码,并且作者修改了头像图片,通过NetworkMiner软件获取了该上传资源。
第一步:启动Wireshark软件,并开始监听流量数据包。
第二步:打开浏览器并输入目标网址。(后续会尝试分析HTTPS网站或手机APP检测)
登录之后如下图所示,作者这里尝试点击链接提交我的一张本地头像。
上传之后如下图所示,接下来我们开始尝试分析抓取的流量数据包。
第四步:获取网址对应的IP地址,这里使用IP站长之家实现。IP地址为:47.110.166.107 。
第五步:点击暂停并通过过滤器获取与该IP地址相关的HTTP协议数据包。 http and ip.addr==47.110.166.107
第六步:选中POST登录提交表单的链接,可以查看对应的用户名和密码如下图所示,双击该行可以查看详情。注意,该网站是明文传输用户名和密码,如果密码加密,可以采用在线MD5解密。还是建议该网站对密码进行加密或设置HTTPS传输。
第七步:右键链接,点击“追踪流”->“TCP流”。
显示的详情内容如下图所示,其中红色为Request,蓝色为服务器响应Response,我们也可以尝试将其导出保存至本地。
第八步:如果过滤器为“ ip.addr==47.110.166.107”,则还除了获取HTTP协议数据包,还能获取其他协议,包括TCP,大多数流量包均通过TCP协议三次握手传输。
这里,读者尝试寻找POST提交图片表单,找到其TCP流的原图片格式进行分析。
第九步:打开工具NetworkMiner,尝试通过它分析数据包。(注意,前面Wireshark抓取的包将存储为本地pcap文件)。
第十步:该软件打开我们本地的0921.pcap文件,显示如下图所示。
第十一步:点击Credentials查看我们Wireshark劫持的所有流量登录信息,可以看到我们目标网站的用户名Yxiuzhang和密码。
第十二步:点击Images可以查看我们上传的图片为“eastmount.jpg”,上传服务器之后头像命名为“17577…jpg”,成果抓取了图像资源。
五.总结
讲到这里,此篇文章讲述完毕。总之,Wireshark是一个非常强大的 工具,希望读者能学会使用它,后续我们将分享如何获取手机APP中的流量。作者也是小白,但仍然在一步一个脚印学习,希望你也能与我同行