当前位置:网站首页>MNIST是什么(plist是什么意思)
MNIST是什么(plist是什么意思)
2022-08-01 11:07:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
初始的迷茫
我想很多菜鸟和我一样,开始零基础学习机器学习,没办法火啊,为了钱大家都是冲呀。估计很多人开始学习ML,就一头雾水,完全不知道在说什么。因为学习模式和学习其他语言完全不同,我们知道学习其他语言的时候,第一个程序就是打印“Hello World”。
其实机器学习是在某个框架下,使用某种语言,来解决问题。因此对于零基础的菜鸟而言,我们需要先学习好某种语言,可以推荐Python,因为功能强大,而且语法相对简单,也可以使用C++。框架呢,个人推荐是TensorFlow2,因为google的大腿粗啊。
什么是MNIST
建议在了解Python后,开始在TF2的框架下进行。
机器学习的入门就是MNIST。MNIST 数据集来自美国国家标准与技术研究所,是NIST(National Institute of Standards and Technology)的缩小版,训练集(training set)由来自 250 个不同人手写的数字构成,其中 50% 是高中学生,50% 来自人口普查局(the Census Bureau)的工作人员,测试集(test set)也是同样比例的手写数字数据。
获取MNIST
MNIST 数据集可在http://yann.lecun.com/exdb/mnist/获取,图片是以字节的形式进行存储,它包含了四个部分:
- Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本)
- Training set labels: train-labels-idx1-ubyte.gz (29 KB, 解压后 60 KB, 包含 60,000 个标签)
- Test set images: t10k-images-idx3-ubyte.gz (1.6 MB, 解压后 7.8 MB, 包含 10,000 个样本)
- Test set labels: t10k-labels-idx1-ubyte.gz (5KB, 解压后 10 KB, 包含 10,000 个标签)
此数据集中,训练样本:共60000个,其中55000个用于训练,另外5000个用于验证。测试样本:共10000个,验证数据比例相同。
数据集中像素值:
a)使用python读取二进制文件方法读取mnist数据集,则读进来的图像像素值为0-255之间;标签是0-9的数值。
b)采用TensorFlow的封装的函数读取mnist,则读进来的图像像素值为0-1之间;标签是0-1值组成的大小为1*10的行向量。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/126875.html原文链接:https://javaforall.cn
边栏推荐
- 上周热点回顾(7.25-7.31)
- OpenHarmony高校技术俱乐部计划发布
- Mysql index related knowledge review one
- 稀疏表示--学习笔记
- Solve vscode input! Unable to quickly generate skeletons (three methods for the new version of vscode to quickly generate skeletons)
- Promise learning (4) The ultimate solution for asynchronous programming async + await: write asynchronous code in a synchronous way
- 进制与转换、关键字
- [CLion] CLion always prompts "This file does not belong to any project target xxx" solution
- 小程序毕设作品之微信美食菜谱小程序毕业设计成品(1)开发概要
- The first experience of Shengsi large model experience platform——Take the small model LeNet as an example
猜你喜欢
C#/VB.NET convert PPT or PPTX to image
A new generation of ultra-safe cellular batteries, Sihao Airun goes on sale starting at 139,900 yuan
.NET深入解析LINQ框架(三:LINQ优雅的前奏)
2022年中盘点 | 产品打底,科技背书,广汽集团阔步向前
数字化转型实践:世界级2B数字化营销的方法框架
千万级乘客排队系统重构&压测方案——总结篇
判断JS数据类型的四种方法
这是我见过写得最烂的Controller层代码,没有之一!
Mini Program Graduation Works WeChat Food Recipes Mini Program Graduation Design Finished Products (3) Background Functions
表达式引擎在转转平台的实践
随机推荐
[Nodejs] node的fs模块
Solve vscode input! Unable to quickly generate skeletons (three methods for the new version of vscode to quickly generate skeletons)
Promise学习(二)一篇文章带你快速了解Promise中的常用API
R语言诊断ARIMA模型:forecast包构建了一个ARIMA模型、使用checkresiduals函数诊断ARIMA模型、并进行结果解读(拟合较差的ARIMA模型具有的特点)
EasyRecovery热门免费数据检测修复软件
开天aPaaS之移动手机号码空号检测【开天aPaaS大作战】
ModelArts-based object detection YOLOv3 practice [play with HUAWEI CLOUD]
pgAdmin 4 v6.12 发布,PostgreSQL 开源图形化管理工具
Browser shortcut keys
(ES6以上以及TS) Map对象转数组
leetcode/submatrix element sum
什么是步进电机?40张图带你了解!
Mysql索引相关的知识复盘一
WPF 截图控件之绘制箭头(五)「仿微信」
shell--第九章练习
Stone Technology builds hard-core brand power and continues to expand the global market
监视网络连接的ss命令
JWT
jmeter
Drawing arrows of WPF screenshot control (5) "Imitation WeChat"