PyTorchとtorchtext

OpenNmt-pyのコード読むために、PyTorchとtorchtextを軽く知っておく必要がある。

VSCodeでデバッグする場合、以下のようなlaunch.jsonを作るとよい。
以下は、preprocess.py をデバッグする場合のサンプル。

{ "version": "0.2.0", "configurations": [ { "name": "Python Debug", "type": "python", "request": "launch", "pythonPath": "~/.pyenv/versions/3.8.5/bin/python", "program": "~/OpenNMT-py/preprocess.py", "console": "integratedTerminal", "args": [ "-train_src", "kftt/kyoto-train.en", "-train_tgt", "kftt/kyoto-train.ja", "-valid_src", "kftt/kyoto-dev.en", "-valid_tgt", "kftt/kyoto-dev.ja", "-save_data", "kftt/demo" ] } ] }
  • pyenv を使用
  • ~/OpenNMT-py に配置

あとついでに、Pythonのイディオム。(zip-forとか)