DictionaryForumContacts

Terms containing stochastic gradient | all forms | exact matches only | in specified order only
SubjectEnglishRussian
dat.proc.asynchronous stochastic gradient descentасинхронный стохастический градиентный спуск (Alex_Odeychuk)
math.stochastic gradientстохастический градиент
media.stochastic gradient adaptive filterадаптивный фильтр, реализующий стохастический градиентный алгоритм
media.stochastic gradient algorithmстохастический градиентный алгоритм (адаптивного регулирования весовых коэффициентов на отводах трансверсального фильтра)
neur.net.stochastic gradient approachподход на основе стохастического градиента (стратегия обучения для модели HME (иерархическое смешение мнений экспертов) clck.ru dimock)
AI.stochastic gradient descentстохастический градиентный спуск (Algorithms use a process called stochastic gradient descent (SGD) to gradually tune a neural network's connections. singularityhub.com Shadowman)
tech.stochastic gradient descentоперативный градиентный спуск (Shadowman)
math.stochastic gradient methodстохастический градиентный метод (clck.ru dimock)
AI.stochastic gradient optimizationстохастическая градиентная оптимизация (Исследования показали, что гиперпараметризация, или реализация нейронных сетей с числом параметров, превышающим количество доступных точек обучающих данных, приносит значительные преимущества. Методы стохастической градиентной оптимизации предотвращают переобучение нейронных сетей благодаря регуляризующему эффекту, который достигается за счёт ранней остановки, которая позволяет нейронным сетям переходить в режим интерполяции, когда обучающие данные подходят почти точно, при этом сохраняя адекватные прогнозы по промежуточным точкам. Примером крупномасштабной сети с гиперпараметризацией является одна из передовых систем распознавания образов – NoisyStudent, которая имеет 480 млн параметров для 1,2 млн точек данных ImageNet. — Research indicates that hyperparameterization — implementing neural networks with more parameters than the available training data points — offers substantial advantages. Stochastic gradient optimization techniques counteract overlearning by leveraging the regularizing power of early stopping, switching neural networks into an interpolation mode, where they align closely with the training data, yet still produce reliable predictions for intermediate values. A prime example of this is the state-of-the-art image recognition system, NoisyStudent, which boasts 480 million parameters, fine-tuned using just 1.2 million ImageNet data points. Alex_Odeychuk)

Get short URL