apice-technologymemorandum
投稿日時:2023/12/22
更新日時:2023/12/24
CHAT GPT日本語OCR 機能を試す
日本語のOCR機能 python ライブラリー がセットできた。Tesseract-OCR というやつです。
これを使ってOCR認識の機能を試してみたいなと思います。
日本語の環境ファイル?というのがないようなので、これをセットすることから始めます。
jpn_traineddata と jpn_ver.traineddata
この2つのファイルを、ローカルでセットアップすると日本語が読めるようです。
この日本語の環境データ? があれば python のOCR機能で日本語対応になるので、
CHAT GPT に このデータをアップすれば理論上 CHAT GPTでどうさする!
動作しましたとのWeb上での報告もあり、やってみました。
事前に CHAT GPTに確認しても、大丈夫とのことでした、あっぷして日本語OCR機能が
機能してくれると思ってましたが、結果はNG CHAT GPT 側で、外部から受け取ったライブラリーはセットアップができないようです。 このあたり CHAT GPT は2023年10月より、大きな機能強化があり、あまたセキュリティ面での強化もあり、10月以前にできたことができなくなっている可能性もありそうです。
もしくは、単純に私が手順を間違ったか。。。
ネット上で、Tesseract-OCR を使ってCHAT GPTに日本語OCR動作ができましたという報告を
2023/10月以降であれば、それを試してみたい 本日 2023/12/23