PyTorchとtorchtext
OpenNmt-pyのコード読むために、PyTorchとtorchtextを軽く知っておく必要がある。
- 第1回 難しくない! PyTorchでニューラルネットワークの基本 external_link
PyTorchをさらっと。 - PyTorch入門 メモ external_link
モデルの保存とか。 - torchtextで簡単にDeepな自然言語処理 external_link
torchtext.data.Fieldとか。 - PyTorch:テキストの前処理(torchtext)① external_link
Dataset構造とか。examplesオブジェクトとか。 - 深層学習モデルの実装を爆速にするVSCodeの設定メモ external_link
VSCodeの設定とか。
VSCodeでデバッグする場合、以下のようなlaunch.jsonを作るとよい。
以下は、preprocess.py をデバッグする場合のサンプル。
{ "version": "0.2.0", "configurations": [ { "name": "Python Debug", "type": "python", "request": "launch", "pythonPath": "~/.pyenv/versions/3.8.5/bin/python", "program": "~/OpenNMT-py/preprocess.py", "console": "integratedTerminal", "args": [ "-train_src", "kftt/kyoto-train.en", "-train_tgt", "kftt/kyoto-train.ja", "-valid_src", "kftt/kyoto-dev.en", "-valid_tgt", "kftt/kyoto-dev.ja", "-save_data", "kftt/demo" ] } ] }
- pyenv を使用
- ~/OpenNMT-py に配置
あとついでに、Pythonのイディオム。(zip-forとか)