メモ帳

python, juliaで機械学習をやっていく

Python

pythonの関数の処理時間計測デコレータ

pythonで実行時間を測定するためにはtime ライブラリ、jupyter上では%time などの使用が有名だと思います。コードの中に余計な処理を書き込みたくない人向けに、decoratorを使って関数の定義部分で宣言するだけで、実行後に処理時間を出力するようにかえる方…

(Part. 2) tensorflow 2.0 betaでtransformerをつかって言語生成chatbotをつくりたい

以下の記事のPart. 2です。 Part. 1ではtransformerの説明とモデルの実装をしました。 この記事ではlossやmetricsを定義し実際に学習を行います。 また、日本語データを用いるために分かち書きも実装しています。 tksmml.hatenablog.com

macの仮想環境化でmatplotlibを簡単に日本語対応させる

以下のように、matplotlibが日本語に対応していないのは有名な問題です。(大量の豆腐が表示されてしまっています。) その、対応として、グローバルにフォントを指定する必要があります。しかし、仮想環境を使っている場合は、それぞれにフォントの設定をし…

(Part. 1) tensorflow 2.0 betaでtransformerをつかって言語生成chatbotをつくりたい

tensorflow2.0のベータ版が公開されたので、慣れるためにtransformerを学習させて、言語生成を試して見たいと思います。 collaboratoryを使ってGPUで学習させます。 コードはこちら のチュートリアルを参考にしました。

アンパック代入を使って代入を簡単にする

pythonでは、「*args」や、「**kwargs」を使ってcollections型の変数を一括代入or受取できます。これは、アンパック代入と言われています。これを使って代入or受取を簡単にできる例をあげていきます。

pythonの参照渡しでハマらないために変数への代入時のメモリの使い方について調べる

pythonの参照渡しでハマらないために変数への代入時のメモリの使い方について調べる

pythonで不必要な空白文字を消去してtokenize

区切り文字でstringを分割してリストにするとき、余計な空白文字が含まれる場合があって邪魔なので、除去する方法を書く。 結論 カンマ区切りでstringを分割する場合 tokens = [f.strip() for f in strings.split(",")]

python 3のwebスクレイピング (beautifulsoup 4)を使って論文リサーチを自動化する

今回のテーマはpythonのwebスクレイピングを用いた自動化です。python 3でbeautifulsoup 4を使って実装してみます。 arxivという論文検索サイトの新着情報を自動取得してみたいと思います。堅苦しく考えずに、とりあえずなにか作ってみて、webスクレイピング…

Hit and BlowをPythonで作る

Python 3でHit and Blowという簡単なゲームを作ってみます。(多分2系でも動きます)