文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python处理mat文件的三种方式小结

2024-04-02 19:55

关注

处理mat文件的三种方式

读书的时候,处理数据都是采用matlab,但毕业后当了程序员,matlab从此在自己的电脑上消失了(安装包太大,还要license,启动也好慢,不符合程序员的需求)。

但是最近公司仿真的数据是以matlab的.mat格式存储的,需要读取出来处理,那就找找python相关的库吧,没有python干不了的活!!!

mat文件存储了matlab中变量数据,因此,python读出的mat数据是以k-v形式存储在字典里,key是变量名,value是数据内容:

scipy

最先想到的的是scipy工具

import scipy.io as scio
data = scio.loadmat(‘example.mat')
data[‘loss']

但是读取有的.mat文件的时,会抛出异常(v7.3版本):

raise NotImplementedError('Please use HDF reader for matlab v7.3 files')NotImplementedError: Please use HDF reader for matlab v7.3 files

h5py

遇到上面的问题,就需要采用h5py库了:

import h5py
data=h5py.loadmat('example.mat')   
data['loss'][:]

但是这样读出来的是file格式,调试的时候都很难知道key是什么,取数据可以按照key来取,但是前提是需要知道key值,不方便独立调试。

mat73

今天的主角登场,个人觉得mat73兼容性最好,几乎所有的mat文件都能成功读取,而且读取的结果是k-v的字典,很便于后续处理:

import mat73
data=mat73.loadmat(path)   
data['loss']

mat4py

不推荐,兼容性较差,可能是没有后续更新。

总结:总的来说,个人比较推荐使用mat73,兼容各种版本的mat文件,其次可以比较清晰的看到mat文件中保存数据的key值,便于后续的提取。 

python操作.mat文件

在win10中,打开

ITC_VD 数据集格式,

结果在训练集ITC_VD_Training_Testing_set中,看到标签文件全是快捷方式,

选中一个文件,右键 属性,看到:

Microsoft Access Table Shortcut (.mat)

查了半天,发现是.mat 的 matlab格式,

python读取.mat格式

from scipy.io import loadmat  
m = loadmat(r"E:\data\yolov5_dbb\ITC_VD_Training_Testing_set\Training\GT/00064.mat")
 
daaa=m.keys()
print(daaa)
 
print(m['x00064'])

.mat 文件里的数据结构是 dict ,所以取值要按照 key:value 的形式:

上面读出来的数据是 ndarray 类型,为了方便数据的展示,我们可以将其转换为,pandas的DataFrame:

import pandas as pd
 
df = pd.DataFrame(m['H_BETA'])
 
df.head()

mat转图片

import glob 
import cv2
import numpy as np
 
r_path=r'C:\File\2021-11'
 
files=glob.glob(r_path+"/*.mat")
from scipy.io import loadmat 
 
# 数据矩阵转图片的函数
def MatrixToImage(data):
    # data = data * 255
    new_im = data.astype(np.uint8)
    return new_im 
 
for file in files:
 
    if "2018" in file:
        continue
    print(file)
    m = loadmat(file)
 
    daaa = m.keys()
 
    data=m['groundTruth']
 
    print(data)
 
    new_im = MatrixToImage(data)
    cv2.imshow("asdf",new_im)
    cv2.waitKey()
 
    # print(data)

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     801人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     348人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     311人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     432人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     220人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯