
いつの間にか公開されていたので、
これにサクっとファインチューニングを施すやつ。
いわゆるフェイク何某にもなりかねないので
一応注意の上、参考程度にしてください。
つまるところ……ある程度、最初から日本語を学習させたBOTに
途中から特定の人物のTwitterから抽出した特徴を転移学習させて
手っ取り早くその人っぽいBOTを作ろう!というやつ。
今回は、これを最小ステップ(TwitterのIDを指定するくらいの作業)で実現したい。
えぇ、そらもう。
流行りに乗っかりますよ。
#必要そうなものを入れる
!git clone https://github.com/tanreinama/gpt2-japanese
!git clone https://github.com/tanreinama/Japanese-BPEEncoder.git
%cd gpt2-japanese
!pip uninstall tensorflow -y
!pip install -r requirements.txt
!wget https://www.nama.ne.jp/models/gpt2ja-small.tar.bz2
!tar xvfj gpt2ja-small.tar.bz2
!mkdir srcdataset
まずは環境構築。
GPT-2日本語モデルを環境にダウンロードして展開。
ついでにファインチューニング用の
データセット作成用エンコーダとそれ用のディレクトリを作ります。
続きを読む