NLP

ナイーブベイズ分類器について

NLP

概要 ナイーブベイズ(単純ベイズ)について調べたので備忘録。 ここでは文書分類を題材に書きます。 説明 数式 一般的にナイーブベイズの数式は下記の通り。 記号 説明 対象とするカテゴリである確率 対象とするカテゴリが含まれている確率 対象とするカテ…

Dockerのマルチステージビルドを試す

概要 Docker 17.05以降でマルチステージビルドという機能が追加された。 matsuand.github.io この機能を利用すると イメージサイズが小さくなる 保守が簡単 可読性が上がる ということらしい。 そこで実際に自分でDockerファイルを書いてイメージファイルが…

hoge.tar.xzが解凍できない

概要 DockerでJuman++の環境構築をしようとしたときにtar -Jxvf jumanpp-2.0.0-rc3.tar.xzの部分で tar (child): xz: Cannot exec: No such file or directory tar (child): Error is not recoverable: exiting now tar: Child returned status 2 tar: Error…

DockerでMeCab+IPA辞書の構築

概要 DockerでMeCab+IPA辞書(+Miniconda)の環境構築 環境 Docker:19.03.8 Dokcerイメージ:frolvlad/alpine-glibc hub.docker.com MeCab:0.996 IPA辞書:2.7.0 コード FROM frolvlad/alpine-glibc ENV PATH /opt/conda/bin:$PATH ENV LANG C.UTF-8 ENV …