17. microgpt の仕様

17.1. この章で学ぶこと

この章は 仕様と入出力 にフォーカスします。コードのブロックごとの詳細は 18 章（microgpt の構造）で全体構造を、19 章以降で順に読みます。

microgpt.py がやっていることは、驚くほど素直です。

図: 学習で state_dict を更新し、生成では同じ重みを読みながらトークンを足していく

最初にやっているのは、学習に使う文字列を集めることです。詳細は 19 章。

次に、文字を整数 ID に変えます。

ここで出てくる主な要素は次の通りです。

学習ループの中身は 19 章（トークナイザー）、23 章（学習ループ）で説明します。

最後は推論です。

BOS から始めて、次の文字を 1 文字ずつ選んでいきます。temperature は低いと無難に、高いと少し冒険しやすくなります。つまり、このコードだけで学習と生成の両方が見えます。

詳細は 24 章。