apice-technologymemorandum
投稿日時:2023/12/22
更新日時:2024/06/11
Python OCRライブラリーpytesseractをローカルPCにインストールする手順
Pythonライブラリーpytesseractっていったい何?
これはOCR機能を有効にするライブラリーです。
Python自体がローカルなPCに入っている前提でセットアップします。 私の場合はWindows11 です。
OPEN AI CHAT GPT はこのライブラリーを使っているようですが、日本語環境のセットをしていないので、日本語対応OCRという形にCHAT GPT が対応していなかったのです。
1コマンドプロンプトまたはターミナルを開く: WindowsではWin + Rを押し、cmdと入力してEnterを押します。MacOSまたはLinuxでは、Terminalを開きます。
2Pythonがインストールされているか確認: コマンドプロンプトまたはターミナルで以下のコマンドを入力します。
CMD(コマンドプロンプト)
python --version
バージョン情報が表示されれば、Pythonはインストールされています。
私のPCは下記のようにでてバージョンが出ないので、おそらくPythonは入ってないような。。
>>python
3.pipがインストールされているか確認: pipはPythonパッケージをインストールするためのツールです。以下のコマンドでバージョン情報を確認します。
CMD
pip --version
C:\Users\user>pip --version
'pip' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。
やはりpython は入ってないようです。
4.pytesseractをインストール: 以下のコマンドでpytesseractをインストールします。
CMD
pip install pytesseract
5.Tesseract OCRエンジンのインストール: pytesseractはPythonライブラリーですが、バックエンドとしてTesseract OCRエンジンを使用します。これは別途インストールする必要があります。Tesseract OCRは以下のURLからダウンロードできます:Tesseract at UB Mannheim。
6.Tesseractのパスを環境変数に設定: Tesseractをインストールした後、システムの環境変数にTesseractのパスを追加する必要があります。これにより、pytesseractがシステム内でTesseractを正しく見つけられるようになります。
7.動作確認: 以下のPythonスクリプトを実行してpytesseractが正しく動作するか確認します。
CMD
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'パス\への\パス\tesseract.exe'
print(pytesseract.image_to_string('画像ファイルへのパス'))
ここでパス\への\パス\tesseract.exeは実際にTesseractがインストールされているパスに置き換えてください。また、画像ファイルへのパスも実際にOCRを適用したい画像のパスに置き換えてください。
これらのステップに従って、pytesseractライブラリーとTesseract OCRエンジンをインストールし、OCR処理を行うことができるようになります。
最後に環境変数を指定する
CMD
C:\Users\user>setx PATH "%PATH%;C:\Program Files\Tesseract-OCR"
成功: 指定した値は保存されました。
これで、日本語OCR 機能が発揮できるようです。