前言
距离上次更新PyQt实战系列隔了好久,因为现实中比较忙,而且确实是存货已经用完,现在对脚本集合包更新了一些新的内容,包括:JSON数据的处理,ADPCM音频编解码,PCM二进制文件构建以及PCMM音频播放功能,此外,还有一个数据加密解密算法,与笔者之前的文章《逆向工程实战,在反汇编中发生的事》中的算法一致,是笔者在反汇编的学习中无意间发现的一种数据加密算法,简单且有效,当初逆向该算法时花了不少时间,总之,这些内容后续都会讲到!
JSON数据处理UI
本功能的UI设计十分简单,用到的全是PyQt5实战系列提及过的内容,因此本文将不再重复讲解UI界面的代码,但是代码依然会贴出来,如下:
|
|
界面非常简单,如下所示
可以看到,在这个页面下仅有一个文件选择的组件加上一个处理的按钮。非常简单的一个页面设计,本文的重点并不在这个UI设计上,而是在wireshark的抓包数据转换成JSON格式以及python提取JSON数据。
JSON数据的来源
本文所使用的JSON数据来源于wireshark抓包,wireshark是一个网络封包分析工具,可以截取各种网络数据包,并显示数据包中的各种详细信息,常用于开发测试过程中的问题定位。但笔者并不是用wireshark来处理网络封包,而是处理低功耗蓝牙(BLE)的封包。wireshark本身并没有捕获BLE数据包的能力,但是结合特殊的dongle可以,使用NRF52832 BLE Sniffer
低功耗蓝牙抓包器可以捕捉到到低功耗蓝牙的空中数据,非常实用,感兴趣的同学可以在网上查询相关信息,本文不做赘述。
这里笔者对一个数据包做了筛选,如下图所示,从机通过notify
的形式向主机传递消息,消息通过handle
值为0x97
的特征传递给主机,这里不了解蓝牙的同学可以不用理会,以后笔者会单独出一个蓝牙系列,分享笔者的蓝牙知识。
在下面详细信息中可以看到,所选中的这一条数据,是从机通过handle
为0x97
的特征,向主机发送共计120
个字节的value
数据:3b 18 01 ....... 04 d1 1a
,如果手动一条一条数据中蓝色框框的内容复制出来是非常耗时的,可以采用以下方式获取数据:
文件 → 导出分组解析结果 → As JSON
可以导出JSON格式的数据,我们展示一下JSON数据
|
|
这么长的数据,仅仅wireshark中展示的一条数据,而我们需要的数据,仅仅是btatt.value
这一个属性
|
|
而敏锐的同学可以发现,此JSON文件的开头,是[
,也就是说,此JSON文件的框架是[{第一条数据},{第二条数据}....{第n条数据}...]
,这种格式非常适合python
通过list
数据结构进行处理。
JSON数据提取
先来观察我们需要的目标数据,btatt.value
,这是由多层字典嵌套在其中的,因此要依次往上查找不同层级的字典,可以发现:
- __source
- layers
- btatt
- btatt.value
是这样的一个结构。
我们现在来看代码
|
|
我们来分析一下代码:
- 从
filename
这个文件中读取数据,以utf-8
编码格式解码 json.load(f)
是指从f
中读取数据JSON
数据,解析并返回对应的Python
对象(例如,字典,列表等,具体取决于JSON的结构),通过我们上面的分析,此json会被解析成python的列表(因为最外层是[]
)。- 循环读取
attvalue
列表对象 - 读取
attvallue
列表中第i
个元素中的layers
字典中的btatt
字典中的btatt.value
所对应的值,并加上一个换行符/n
,最后复制给voicevalue
- 将
voicevalue
写进workspaces/VoiceData.txt
文件的末尾,a
表示在文件末尾写入东西,而不覆盖原来的内容。 - 当将所有的内容都写完时,返回每条数据的数据量以及数据总量
该方法被单独写在wiresharckJsonProcess.py
文件中,存放在tools
目录下,被UI页面通过import
以模块导入的形式使用。
总结
本文的内容并不复杂,主要是如何从wireshark
中导出JSON
数据,以及如何使用python
对数据进行过滤和处理,JSON是非常常用的数据传输和保存格式尤其在网络中非常常用,因此熟练的掌握看懂和处理对程序员来说是值得的,而且并不难不是吗,祝你变得更强!