基于卷积神经网络的手写数字识别（Matlab 实现）-尧图企业网站定制

基于卷积神经网络的手写数字识别matlab实现基于CNN的matlab手写数字识别可以加Lenet-5模型数据集自制数字大小5*5 训练过程良好识别准确率在95%以上数值图像主成分分析提取像素点包含图片输入和手写板输入两种方式加50在机器学习领域手写数字识别是一个经典的项目。今天咱们就来聊聊如何用 Matlab 基于卷积神经网络CNN实现手写数字识别并且会用到 Lenet - 5 模型还会涉及自制数据集以及多种输入方式等有趣的内容。一、数据集自制这次我们自己制作数据集设定数字大小为 5 * 5。自制数据集的好处是能更好地贴合我们的需求。下面是简单生成一些示例数据的代码% 生成 5*5 手写数字 0 的示例数据 digit_0 [0 0 0 0 0; 0 1 1 1 0; 0 1 0 1 0; 0 1 1 1 0; 0 0 0 0 0]; % 生成 5*5 手写数字 1 的示例数据 digit_1 [0 0 1 0 0; 0 1 1 0 0; 0 0 1 0 0; 0 0 1 0 0; 0 1 1 1 0]; % 以此类推生成其他数字的数据 % 将数据整理成训练集格式 training_data []; training_labels []; % 假设已经生成了 0 - 9 的数据将其加入训练集 for i 1:10 % 假设 digit_i 为数字 i 的 5*5 数据 training_data cat(3, training_data, digit_i); training_labels [training_labels; i]; end在这段代码里我们先分别定义了数字 0 和 1 的 5 * 5 矩阵表示实际应用中要生成 0 - 9 所有数字的数据。然后通过cat函数将这些数据按第三个维度拼接起来组成训练数据同时记录对应的标签。二、主成分分析提取像素点主成分分析PCA能帮助我们从数据中提取主要特征减少数据维度的同时保留关键信息。Matlab 里实现 PCA 提取像素点特征很方便% 将训练数据转换为二维矩阵每一行是一个样本 data_matrix reshape(training_data, 25, []); % 进行 PCA 分析 [coeff, score, latent] pca(data_matrix); % 选择前几个主成分这里假设选 10 个 num_components 10; selected_coeff coeff(:, 1:num_components); % 对训练数据进行降维 reduced_training_data data_matrix * selected_coeff;这段代码首先把三维的训练数据重塑成二维矩阵每一行代表一个样本。然后通过pca函数进行主成分分析得到主成分系数coeff、得分score和方差latent。我们选择前 10 个主成分用这些主成分系数对训练数据进行降维得到降维后的训练数据reducedtrainingdata。三、Lenet - 5 模型搭建Lenet - 5 是经典的 CNN 模型在手写数字识别上表现出色。在 Matlab 里搭建 Lenet - 5 模型如下layers [ imageInputLayer([5 5 1]) convolution2dLayer(5,20,Padding,same) reluLayer() maxPooling2dLayer(2,Stride,2) convolution2dLayer(5,50,Padding,same) reluLayer() maxPooling2dLayer(2,Stride,2) fullyConnectedLayer(500) reluLayer() fullyConnectedLayer(10) softmaxLayer() classificationLayer()];imageInputLayer定义了输入图像的大小这里是 55 的单通道图像。接着是卷积层convolution2dLayer使用 55 的卷积核分别输出 20 个和 50 个特征图Padding设置为same保证输出尺寸和输入一样。reluLayer加入激活函数增强模型的非线性表达能力。maxPooling2dLayer进行池化操作减少数据维度。最后通过全连接层fullyConnectedLayer将特征映射到 10 个类别对应 0 - 9 数字softmaxLayer输出概率分布classificationLayer用于分类。四、训练模型options trainingOptions(adam,... MaxEpochs,50,... InitialLearnRate,0.001,... ValidationData,{validation_data, validation_labels},... ValidationFrequency,10,... Verbose,false,... Plots,training-progress); net trainNetwork(reduced_training_data, training_labels, layers, options);这里使用adam优化器设置最大训练轮数MaxEpochs为 50初始学习率InitialLearnRate为 0.001。我们还指定了验证数据validationdata和验证标签validationlabels每 10 轮进行一次验证。Verbose设置为false不显示详细训练信息同时开启训练进度图Plots。通过trainNetwork函数进行模型训练。五、识别准确率与可视化训练完成后我们来看看模型的识别准确率。predicted_labels classify(net, test_data); accuracy sum(predicted_labels test_labels) / numel(test_labels); fprintf(识别准确率: %.2f%%\n, accuracy * 100);这段代码用训练好的模型net对测试数据testdata进行分类预测得到预测标签predictedlabels。通过比较预测标签和真实标签test_labels计算出识别准确率并打印出来。在实际训练过程中我们得到的识别准确率在 95% 以上。基于卷积神经网络的手写数字识别matlab实现基于CNN的matlab手写数字识别可以加Lenet-5模型数据集自制数字大小5*5 训练过程良好识别准确率在95%以上数值图像主成分分析提取像素点包含图片输入和手写板输入两种方式加50为了更直观地感受模型的效果我们可以绘制混淆矩阵。confusionmat(test_labels, predicted_labels);这行代码能生成混淆矩阵通过可视化混淆矩阵我们能清楚看到模型在不同数字类别上的预测情况比如哪些数字容易被误判等。六、输入方式图片输入Matlab 可以很方便地处理图片输入。假设我们有一张 5 * 5 的手写数字图片img imread(handwritten_digit.png); % 转换为灰度图如果是彩色图 if size(img, 3) 3 img rgb2gray(img); end % 调整图像大小为 5*5 img imresize(img, [5 5]); % 将图像转换为模型可接受的格式 input_img im2double(img); input_img reshape(input_img, [5 5 1]); % 进行预测 predicted_digit classify(net, input_img);这段代码先读取图片判断是否为彩色图并转换为灰度图然后调整图像大小为 5 * 5再转换为双精度类型并重塑成模型输入格式最后用训练好的模型进行预测。手写板输入Matlab 本身没有直接的手写板输入功能但可以结合一些外部工具或者通过模拟实现。这里简单说一种思路通过获取鼠标在图形界面上的轨迹模拟手写过程将轨迹数据转换为 5 * 5 的图像数据再按照图片输入的方式进行处理和预测。通过以上步骤我们成功地基于卷积神经网络在 Matlab 中实现了手写数字识别利用自制数据集和 Lenet - 5 模型达到了较高的识别准确率同时也探索了多种输入方式为手写数字识别应用提供了更多可能。希望大家对这个有趣的项目有更深入的了解一起在机器学习的世界里探索更多精彩。

相关新闻

OpenClaw技能市场探索：最适合GLM-4.7-Flash的5个实用技能推荐

国内想走 Palantir 路线，最容易补错的不是产品能力，而是实施组织能力

【详解】使用Java解决字符串排序（利用容器类中的sort方法）

DLSS Swapper终极指南：如何一键智能切换DLSS版本，彻底释放显卡性能

如何3分钟免费解锁Microsoft 365完整功能？Office激活工具Ohook详解

oh-my-pi：开源可编程AI编程助手架构解析

Copilot工程实践：上下文窗口、Plan Agent与TDD协同方法论

VS Code集群远程开发：免密信任链与远程Agent实战

终极指南：3分钟解锁你的QQ聊天记录数据库

A股股指期货：全维度解析（多表格结构化完整版）

ByteHouse：云原生数据仓库的架构解析与最佳实践

校园服饰细分赛道测算程序，学生平价国风，机能穿搭市场规模预估。

从论文到实践：一维卷积神经网络在RUL预测中的复现与调优

工业4-20mA电流环信号传输与XTR116应用设计

TPAFE0808与PIC18F87K22的多通道信号采集方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

YOLOv8推理性能优化：从1.2FPS到35FPS的全链路加速实践

NVIDIA显示器色彩校准终极指南：5分钟实现专业级sRGB色彩还原