大家好,今天给各位分享MNIST 数据集详解与读取方法的一些知识,其中也会对进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧!
下载
官网http://yann.lecun.com/exdb/mnist/共4个文件,训练集、训练集标签、测试集、测试集标签文件名大小内容train-images-idx3-ubyte.gz9,681 kb55000图片训练集、5000个验证集train-labels-idx1-ubyte.gz29 kb 训练集图片对应标签t10k-images-idx3-ubyte.gz1、611 kb10000 测试集t10k-labels-idx1-ubyte.gz5 kb 测试集标签对应图片为
读入MNIST数据集
。直接下载的数据无法被应用程序解压或打开,因为这些文件不是任何标准的图像格式,而是以字节的形式存储,因此必须编写程序来打开它。
使用TensorFlow进行解压
使用TensorFlow 中的input_data.py 脚本读取数据和标签。使用该方法时,无需提前下载数据集。它会自动下载并将其存储在您指定的位置。
从tensorflow.examples.tutorials.mnist导入input_data
将matplotlib.pyplot 导入为plt
mnist=input_data.read_data_sets("MNIST_data",one_hot=True) # MNIST_data是指存储数据的文件夹路径,one_hot=True表示使用one_hot编码方式对标签进行编码
#加载数据
train_X=mnist.train.images #训练集样本
validation_X=mnist.validation.images #验证集样本
test_X=mnist.test.images #测试集样本
#标签
train_Y=mnist.train.labels #训练集标签
validation_Y=mnist.validation.labels #验证集标签
test_Y=mnist.test.labels #测试集标签
print(train_X.shape,train_Y.shape) #输出训练集样本和标签的大小
#查看数据,比如训练集中第一个样本的内容和标签
print(train_X[0]) # 是一个包含784 个元素的向量,其值在[0,1] 之间
打印(train_Y[0])
#可视化样本,以下是训练集中前20个样本的输出
图,ax=plt.subplots(nrows=4,ncols=5,sharex="all",sharey="all")
斧头=斧头.展平()
对于范围(20): 内的i
img=train_X[i].reshape(28, 28)
ax[i].imshow(img,cmap="灰色")
ax[0].set_xticks([])
ax[0].set_yticks([])
plt.tight_layout()
plt.show() 的输出是
(55000, 784) (55000, 10) #训练集样本和标签大小
第一个样例的内容输出较多,故省略。
[0。 0. 0. 0. 0. 0. 0. 1. 0. 0.] #第一个样本的标签,one-hot编码,只有对应位置的值为1,其余在训练集之前均为0 20 个示例图形
参考资料
【MNIST 数据集详解与读取方法】相关文章:
2.米颠拜石
3.王羲之临池学书
8.郑板桥轶事十则
用户评论
终于找到了关于MNIST数据集的解释!想学深度学习,这个基本要了解。
有5位网友表示赞同!
我一直都想学习一下手写数字识别,MNIST数据集应该是一个很好的入门资料吧?
有9位网友表示赞同!
感觉这个数据集还挺有用的,用来测试机器学习模型效果不错。
有17位网友表示赞同!
之前在网上看到有人用MNIST训练了神经网络做图像分类,现在看来就是从这里获取数据集的啊!
有17位网友表示赞同!
机器学习里这些基础数据集都很重要,了解MNIST能让我更好地理解其他的数据集吧。
有12位网友表示赞同!
这篇文章介绍得挺详细的,图片也很清楚,方便我跟着学习。
有14位网友表示赞同!
以后要是尝试做项目用到手写数字识别,就知道从哪里找数据了!
有8位网友表示赞同!
原来MNIST数据集包含黑白图像,我还是比较喜欢彩色图像的数据集呢。
有7位网友表示赞同!
希望这篇文章能解释清楚如何读取这个数据集,我需要把它用Python处理一下。
有13位网友表示赞同!
学习机器学习总觉得要从基础开始,MNIST数据集应该是一个很好的起点啊!
有7位网友表示赞同!
不知道其他的手写识别数据集怎么样,有没有什么比MNIST更好的?
有18位网友表示赞同!
这篇文章介绍了数据集的规模和内容,感觉比较适合入门学习的人看。
有11位网友表示赞同!
看到标题里是"读取”,说明这个数据集可以直接使用吗?不用自己采集数据了?
有8位网友表示赞同!
想试试用开源的AI工具来读MNIST数据集,看看效果怎么样!
有5位网友表示赞同!
最近在学图像识别,知道MNIST是一个基本的数据集,但没有认真看过介绍,现在正好借这个机会了解一下。
有14位网友表示赞同!
文章中提到的读取方法很关键,需要好好理解才能用数据训练模型吧!
有11位网友表示赞同!
学习机器学习果然要从这些基础开始,像MNIST这样的数据集非常重要。
有9位网友表示赞同!
感觉这篇介绍挺不错,把我对MNIST数据集的理解补充清楚了。
有16位网友表示赞同!