apice-technologymemorandum

Python OCRライブラリーpytesseractをローカルPCにインストールする手順

Pythonライブラリーpytesseractっていったい何?
これはOCR機能を有効にするライブラリーです。
Python自体がローカルなPCに入っている前提でセットアップします。 私の場合はWindows11 です。

OPEN AI CHAT GPT はこのライブラリーを使っているようですが、日本語環境のセットをしていないので、日本語対応OCRという形にCHAT GPT が対応していなかったのです。



1コマンドプロンプトまたはターミナルを開く: WindowsではWin + Rを押し、cmdと入力してEnterを押します。MacOSまたはLinuxでは、Terminalを開きます。

2Pythonがインストールされているか確認: コマンドプロンプトまたはターミナルで以下のコマンドを入力します。

CMD(コマンドプロンプト)
python --version

バージョン情報が表示されれば、Pythonはインストールされています。

私のPCは下記のようにでてバージョンが出ないので、おそらくPythonは入ってないような。。

>>python

3.pipがインストールされているか確認: pipはPythonパッケージをインストールするためのツールです。以下のコマンドでバージョン情報を確認します。

CMD
pip --version

C:\Users\user>pip --version
'pip' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。

やはりpython は入ってないようです。

4.pytesseractをインストール: 以下のコマンドでpytesseractをインストールします。
CMD
pip install pytesseract

5.Tesseract OCRエンジンのインストール: pytesseractはPythonライブラリーですが、バックエンドとしてTesseract OCRエンジンを使用します。これは別途インストールする必要があります。Tesseract OCRは以下のURLからダウンロードできます:Tesseract at UB Mannheim。

6.Tesseractのパスを環境変数に設定: Tesseractをインストールした後、システムの環境変数にTesseractのパスを追加する必要があります。これにより、pytesseractがシステム内でTesseractを正しく見つけられるようになります。

7.動作確認: 以下のPythonスクリプトを実行してpytesseractが正しく動作するか確認します。


CMD
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'パス\への\パス\tesseract.exe'
print(pytesseract.image_to_string('画像ファイルへのパス'))


ここでパス\への\パス\tesseract.exeは実際にTesseractがインストールされているパスに置き換えてください。また、画像ファイルへのパスも実際にOCRを適用したい画像のパスに置き換えてください。

これらのステップに従って、pytesseractライブラリーとTesseract OCRエンジンをインストールし、OCR処理を行うことができるようになります。




最後に環境変数を指定する

CMD
C:\Users\user>setx PATH "%PATH%;C:\Program Files\Tesseract-OCR"

成功: 指定した値は保存されました。

これで、日本語OCR 機能が発揮できるようです。

AI関連カテゴリーに戻る

1