Многие знают, что когда модели обучаются, где-то под капотом перемножаются матрицы и тензоры, и все это связано с дифференцированием. Мы с Денисом Степановым взялись за нелегкую задачу – разобраться, что же именно там происходит! Полезные ссылки: — Dive into Deep Learning Aston Zhang, Zachary C. Lipton, Mu Li, Alexander J. Smola (online book with code and formulas) =dp_byline_sr_book_2?ie=UTF8&field-author=Zachary+C.+Lipton&text=Zachary+C.+Lipton&sort=relevancerank&search-alias=books — Micrograd by Andrej Karpathy — Andrej Karpathy builds GPT from scratch — Scott Aaronson on LLM Watermarking — Annotated history of Modern AI and Deep Learning by Jurgen Schmidhuber ~juergen/ — Probabilistic Machine Learning: An Introduction Kevin Patrick Murphy — Probabilistic Machine Learning: Advanced Topics Kevin Patrick Murphy — Pattern Recognition and Machine Learning Christopher Bishop — Deep Learning: Foundations and Concepts Christopher Bishop, Hugh Bishop — Deep Learning Ian Goodfellow, Yoshua Bengio, Aaron Courville — Глубокое обучение: Погружение в мир нейронных сетей С. Николенко, А. Кадурин, Е. Архангельская ,%20Neural%20Networks/%D0%93%D0%BB%D1%83%D0%B1%D0%BE%D0%BA%D0%BE%D0%B5%20%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5%20(%D0%9D%D0%B8%D0%BA%D0%BE%D0%BB%D0%B5%D0%BD%D0%BA%D0%BE).pdf — Gonzo-обзоры ML статей Григорий Сапунов, Алексей Тихонов — Machine Learning Street Talk podcast — Feedforward NNs, Autograd, Backprop (Datalore report, Denis Stepanov) — Softmax Regression, Adversarial Attacks (Datalore report, Denis Stepanov) — Dual Numbers, PINN (Datalore report, Denis Stepanov) ❓ Хочешь обсудить выпуск или задать вопрос эксперту? Вступай в наш Telegram-чат: 📰 Не любишь чаты, но хочешь оставаться в курсе дел и прокачивать свой IT кругозор? Подписывайся на наш Telegram-канал: там публикуются анонсы новых выпусков, а в комментах идут ценные и горячие обсуждения! 5 тысяч опытных IT-специалистов уже с нами: 👉Предложить себя в подкаст Тайм-коды: 00:00 О чем выпуск 05:33 Значение понимания ИИ 11:23 Математические основы Deep Learning 44:03 Вероятностные аспекты обучения 51:25 Функции активации 01:01:50 Обучение с учителем и без учителя 01:13:15 Обратное распространение ошибки 01:15:30 Использование Python в тензорных вычислениях 01:18:03 Ватермаркинг в языковых моделях 01:26:13 Что такое гиперпараметры 01:31:45 Применение языковых моделей в математике 01:37:45 Заключение











