タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

UbuntuとOCRに関するrichard_rawのブックマーク (1)

  • 第577回 Tesseract OCRで文字認識をする | gihyo.jp

    今回はオープンソースでマルチプラットフォームのOCRエンジンであるTesseract OCRを使用し、読み取り精度を確認してみます。 UbuntuでOCR? 「日語でOCR」と聞くと、プロプライエタリの牙城というか、高価なソフトを購入しないと実用に耐えないというイメージがあるかもしれません。あるいはないかもしれませんが、いずれにせよ日語の文字は難しいのでOCRで高い精度を出すのはなかなか難しそうに思えます。 少なくとも筆者はそう考えていたので、OCRで高精度の結果を出すのは困難、ましてやオープンソースで……と考えていました。そんなところに、Tesseract OCRのバージョン4.0以降では日語でもかなりの高精度で認識するという話を小耳に挟みました。実際に試してみると想定していた以上の結果だったので、ここで紹介することにします。 Tesseract OCRとgImageReader

    第577回 Tesseract OCRで文字認識をする | gihyo.jp
    richard_raw
    richard_raw 2023/01/24
    GUIフロントエンドのgImageReaderはWindows版もありました。便利。/斜体の認識率は低いですね。
  • 1