Fast gradient descent algorithm for image classification with neural networks

被引：0

作者：

Abdelkrim El Mouatasim

机构：

[1] Ibn Zohr University,Faculty of Polydisciplinary Ouarzazate (FPO)

来源：

Signal, Image and Video Processing | 2020年 / 14卷

关键词：

Gradient algorithm; Nesterov algorithm; Learning rate control; Image classification; Neural networks;

D O I：

暂无

中图分类号：

学科分类号：

摘要：

Any optimization of gradient descent methods involves selecting a learning rate. Tuning the learning rate can quickly become repetitive with deeper models of image classification, does not necessarily lead to optimal convergence. We proposed in this paper, a modification of the gradient descent algorithm in which the Nestrove step is added, and the learning rate is update in each epoch. Instead, we learn learning rate itself, either by Armijo rule, or by control step. Our algorithm called fast gradient descent (FGD) for solving image classification with neural networks problems, the quadratic convergence rate o(k2)\documentclass[12pt]{minimal} \usepackage{amsmath} \usepackage{wasysym} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage{mathrsfs} \usepackage{upgreek} \setlength{\oddsidemargin}{-69pt} \begin{document}$$o(k^2)$$\end{document} of FGD algorithm are proved. FGD algorithm are applicate to a MNIST dataset. The numerical experiment, show that our approach FGD algorithm is faster than gradient descent algorithms.

引用

页码：1565 / 1572

页数：7

共 50 条

[31] Understanding Approximate Fisher Information for Fast Convergence of Natural Gradient Descent in Wide Neural Networks
Karakida, Ryo
Osawa, Kazuki
ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 33, NEURIPS 2020, 2020, 33
[32] An approximate gradient descent algorithm for Spiking Neural Network
Chen, Wenjie
Li, Chuandong
2023 35TH CHINESE CONTROL AND DECISION CONFERENCE, CCDC, 2023, : 4690 - 4694
[33] A Convergence Analysis of Gradient Descent on Graph Neural Networks
Awasthi, Pranjal
Das, Abhimanyu
Gollapudi, Sreenivas
ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 34 (NEURIPS 2021), 2021, 34
[34] Learning Graph Neural Networks with Approximate Gradient Descent
Li, Qunwei
Zou, Shaofeng
Zhong, Wenliang
THIRTY-FIFTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, THIRTY-THIRD CONFERENCE ON INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE AND THE ELEVENTH SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2021, 35 : 8438 - 8446
[35] Calibrated Stochastic Gradient Descent for Convolutional Neural Networks
Zhuo, Li'an
Zhang, Baochang
Chen, Chen
Ye, Qixiang
Liu, Jianzhuang
Doermann, David
THIRTY-THIRD AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE / THIRTY-FIRST INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE CONFERENCE / NINTH AAAI SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2019, : 9348 - 9355
[36] Gradient descent learning for quaternionic Hopfield neural networks
Kobayashi, Masaki
NEUROCOMPUTING, 2017, 260 : 174 - 179
[37] Analysis of natural gradient descent for multilayer neural networks
Rattray, M
Saad, D
PHYSICAL REVIEW E, 1999, 59 (04): : 4523 - 4532
[38] Generalization Guarantees of Gradient Descent for Shallow Neural Networks
Wang, Puyu
Lei, Yunwen
Wang, Di
Ying, Yiming
Zhou, Ding-Xuan
NEURAL COMPUTATION, 2025, 37 (02) : 344 - 402
[39] Convergence of gradient descent for learning linear neural networks
Nguegnang, Gabin Maxime
Rauhut, Holger
Terstiege, Ulrich
ADVANCES IN CONTINUOUS AND DISCRETE MODELS, 2024, 2024 (01):
[40] Optimization of Graph Neural Networks with Natural Gradient Descent
Izadi, Mohammad Rasool
Fang, Yihao
Stevenson, Robert
Lin, Lizhen
2020 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA), 2020, : 171 - 179

← 1 2 3 4 5 →