メモ帳

python, juliaで機械学習をやっていく

NLP (自然言語処理)

ReformerをTrax (tensor2tensorの後継)で使ってみた

機械学習 NLP (自然言語処理) Trax

本記事の目的 Reformerの著者実装 (Trax) を使ってみる！！！ Traxで学習・推論するための一連の流れをまとめる Reformerとは Transformerの大幅な計算効率の向上・省メモリ化に成功

(Part 2) tensorflow 2 でhugging faceのtransformers公式のBERT日本語学習済みモデルを文書分類モデルにfine-tuningする

NLP (自然言語処理) Tensorflow 2.0 機械学習

hugging faceのtransformersというライブラリを使用してBERTのfine-tuningを試しました。日本語サポートの拡充についてざっくりまとめて、前回いまいちだった日本語文書分類モデルを今回追加された学習済みモデル (bert-base-japanese, bert-base-japanese-c…

#tensorflow2 #BERT

自然言語処理のData Augmentation手法 (Easy Data Augmentation)

論文読み NLP (自然言語処理)

自然言語処理 Advent Calendar 2019の10日目です。本記事では、以下の論文の概要をまとめます。EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks [Jason W. Wei, Kai Zou; 2019].

(Part 1) tensorflow2でhuggingfaceのtransformersを使ってBERTを文書分類モデルに転移学習する

NLP (自然言語処理) Tensorflow 2.0 機械学習

現在、NLPの分野でも転移学習やfine-tuningで高い精度がでる時代になっています。おそらく最も名高いであろうBERTをはじめとして、競ってモデルが開発されています。 BERTは公式のtensorflow実装は公開されてありますが、画像分野の転移学習モデルに比べる…

#NLP #tensorflow2 #BERT

kerasで学習済みword2vecをembedding layerに組み込む方法

NLP (自然言語処理) keras 機械学習

kerasで学習済みword2vecをモデルに組み込む方法を紹介します。word2vecなどで学習した分散表現（token id毎のベクトル値）をkerasのembedding layerの重みに設定し、新たに学習させないように指定するという流れです。こうすることで、word2vecによる特徴量…

#Keras #Word2Vec #NLP

(Part. 2) tensorflow 2.0 betaでtransformerをつかって言語生成chatbotをつくりたい

Python Tensorflow 2.0 NLP (自然言語処理) 機械学習

以下の記事のPart. 2です。 Part. 1ではtransformerの説明とモデルの実装をしました。この記事ではlossやmetricsを定義し実際に学習を行います。また、日本語データを用いるために分かち書きも実装しています。 tksmml.hatenablog.com

#NLP #Transformer #tensorflow2

(Part. 1) tensorflow 2.0 betaでtransformerをつかって言語生成chatbotをつくりたい

Tensorflow 2.0 Python NLP (自然言語処理) 機械学習

tensorflow2.0のベータ版が公開されたので、慣れるためにtransformerを学習させて、言語生成を試して見たいと思います。 collaboratoryを使ってGPUで学習させます。コードはこちらのチュートリアルを参考にしました。

#NLP #Transformer #tensorflow2