概要
DockerでMeCab+IPA辞書(+Miniconda)の環境構築
環境
- Docker:19.03.8
- Dokcerイメージ:frolvlad/alpine-glibc hub.docker.com
- MeCab:0.996
- IPA辞書:2.7.0
コード
FROM frolvlad/alpine-glibc ENV PATH /opt/conda/bin:$PATH ENV LANG C.UTF-8 ENV MINICONDA Miniconda3-latest-Linux-x86_64.sh ENV MECAB_URL https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE ENV MECAB_VERSION mecab-0.996 ENV MECAB_DIC_URL https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM ENV MECAB_DIC_VERSION mecab-ipadic-2.7.0-20070801 RUN apk add --update --no-cache wget bash build-base make && \ wget -q --no-check-certificate https://repo.continuum.io/miniconda/$MINICONDA && \ bash /Miniconda3-latest-Linux-x86_64.sh -b -p /opt/conda && \ pip install mecab-python3 && \ ln -s /opt/conda/bin/* /usr/local/bin/ && \ wget -q --no-check-certificate ${MECAB_URL} -O ${MECAB_VERSION}.tar.gz && \ tar zxf ${MECAB_VERSION}.tar.gz && \ cd ${MECAB_VERSION} && \ ./configure --with-charset=utf8 && \ make && \ make install && \ cd .. && \ rm ${MECAB_VERSION}.tar.gz && \ wget ${MECAB_DIC_URL} -O ${MECAB_DIC_VERSION}.tar.gz && \ tar -xvf ${MECAB_DIC_VERSION}.tar.gz && \ cd ${MECAB_DIC_VERSION} && \ ./configure --with-charset=utf8 && \ make && \ make install && \ cd .. && \ rm ${MECAB_DIC_VERSION}.tar.gz && \ rm -rf /root/.[acpw]* /$MINICONDA /opt/conda/pkgs/*
少しだけ解説
Dockerイメージ でalpineではなくfrolvlad/alpine-glibcを使った理由は、pythonのモジュール(numpyなど)を利用するときにglibcが必要なため。
自分でglibcをインストールする方法があるが、Docker hubで構築している環境の方が最適化されているために使わせて頂きました。
おわりに
今後は更に他の辞書(jumanなど)も構築していきたい。