Город МОСКОВСКИЙ

02:06:25

Let's build GPT from scratch, in code, spelled out (перевод)

Name: Let's build GPT from scratch, in code, spelled out (перевод)
Uploaded: 2025-06-04T11:07:21+03:00
Duration: 7585 s
Channel: Невероятные возможности
Description: Оригинал: https://www.youtube.com/watch?v=kCc8FmEb1nY Мы строим Generatively Pretrained Transformer (GPT), следуя статье "Attention is All You Need" и моделям O...

Невероятные возможности

Просмотры:
15

Дата загрузки:
04.06.2025 11:07

Длительность:
02:06:25

Категория:
Лайфстайл

Описание

Оригинал: https://www.youtube.com/watch?v=kCc8FmEb1nY

Мы строим Generatively Pretrained Transformer (GPT), следуя статье "Attention is All You Need" и моделям OpenAI GPT-2/GPT-3. Обсуждаем связи с ChatGPT, который покорил мир. Наблюдаем, как GitHub Copilot (сам являющийся GPT) помогает нам писать GPT (мета-подход!). Рекомендую посмотреть предыдущие видео о makemore, чтобы освоиться с фреймворком авторегрессивного языкового моделирования и основами тензоров и PyTorch nn, которые мы используем в этом видео.

## Ссылки:
- Google Colab для видео: https://colab.research.google.com/dri...
- GitHub-репозиторий для видео: https://github.com/karpathy/ng-video-...
- Плейлист всей серии "Zero to Hero": • The spelled-out intro to neural netwo...
- Репозиторий nanoGPT: https://github.com/karpathy/nanoGPT
- Мой веб-сайт: https://karpathy.ai
- Мой Twitter: / karpathy
- Наш канал Discord: / discord

## Дополнительные ссылки:
- Статья "Attention is All You Need": https://arxiv.org/abs/1706.03762
- Статья OpenAI GPT-3: https://arxiv.org/abs/2005.14165
- Блог-пост OpenAI о ChatGPT: https://openai.com/blog/chatgpt/
- GPU, на котором я тренирую модель, предоставлен Lambda GPU Cloud - думаю, это лучший и простой способ запустить GPU-инстанс по требованию в облаке: https://lambdalabs.com. Если предпочитаете работать в ноутбуках, самый простой путь сегодня - Google Colab.

## Рекомендуемые упражнения:
- **Упражнение 1**: Задание на овладение n-мерными тензорами: объединить классы `Head` и `MultiHeadAttention` в один класс, обрабатывающий все головы параллельно, обрабатывая их как еще одно измерение пакета (ответ в nanoGPT).
- **Упражнение 2**: Обучите GPT на своем собственном наборе данных! Какие еще данные было бы интересно моделировать?
- **Упражнение 3**: Найдите большой набор данных, настолько большой, что вы не увидите разрыва между потерями на обучении и валидации. Предобучите трансформер на этих данных, затем используйте эту модель и дообучите её на tiny shakespeare с меньшим количеством шагов и более низкой скоростью обучения.
- **Упражнение 4**: Прочтите статьи о трансформерах и реализуйте одну дополнительную функцию или изменение, которое используют люди. Улучшает ли это производительность вашего GPT?

## Разделы видео:
[список разделов, который я не буду переводить полностью из-за ограничений длины ответа]

## Исправления:
00:57:00 Ошибка: "токены из будущего не могут общаться", а не "из прошлого". Извините! :)
01:20:05 Ошибка: я должен использовать head_size для нормализации, а не C.

Рекомендуемые видео

F. R. DAVID «Words» (The Album) 1982

552 просмотров

Tangerin Ear Licking (3Dio)

3 517 просмотров

Tangerin Ear Licking (3Dio) standing

3 301 просмотров

Uppermoons [+Muzan) React To Random Tiktoks, 1, , Demon Slayer, Kny, Earape On The End

392 просмотров

🚄 4К SmartTV ➤ 🌄 Поездка в Сен‑Гингольф → Бриг (Регионалпс, Швейцария, июнь 2025 г.)! 🌄

985 просмотров

Dj Alex John - Alex John - Trancemeditation.(Discover Trance Radio) Music Mix 2025

1 544 просмотров

ASMR Ear Eating + Licking (3dio)

17 950 просмотров

«Три поросёнка» (v2.0 by AICyberSongs, Чёрные сказки, Rock is...)

1 744 просмотров

Gürcan Erdem (Turkey) - Disco Pop mix (Original) vol.I

2 817 просмотров

Dire Straits (Scotland) - 'Classic Blues' lyric mix (Original)

6 083 просмотров

🚄 4К SmartTV ➤ 🌄 Из Никшича в Подгорицу, ŽPCG, Черногория, июнь 2025 г.! 🌄

1 024 просмотров

Stakatto - errorerror .Dark Progressive, Progressive House Music Mix 2026

2 868 просмотров

Треш Тиктоки по Forsaken Роблокс! (удалите их..)

12 202 просмотров

Brain Test, Hole. io, Bowmasters, Cut The Rope Free

1 319 просмотров

Food Run,Steal the MemeRot,LAYER MAN,Sculpt People,Brain Test 5,Night Survive in Haunt,Dancing Cats

956 просмотров

The Violin Stepped Into Chaos and Didn’t Back Down

1 660 просмотров

Трамп возмутил китайцев / Трагедия в Карелии / С флагом и гимном! / РЕН Новости 12:30, 15.05.2026

6 614 просмотров

[Тим Тин] - Барби и Кен Стали Родителями! Как Помирить Родителей?

4 805 просмотров

Гарри Поттер и Тайная комната | Harry Potter and the Chamber of Secrets (2002)

5 136 262 просмотров

Мстители 1 (фильм, 2012)

1 502 379 просмотров