投稿者 スレッド: snipping toolのOCR技術を使って看板の文字を取り込んでみた  (参照数 421 回)

admin

  • Administrator
  • Hero Member
  • *****
  • 投稿: 59139
    • プロフィールを見る
snipping toolのOCR技術を使って看板の文字を取り込んでみた
« 投稿日:: 12月 23, 2023, 06:52:42 pm »
snipping toolのOCR技術を使って看板の文字を取り込んでみた
https://3yokohama.hatenablog.jp/entry/2023/12/23/184549

snipping toolのOCR技術を使って、写真にある看板を取り込んで文字を抽出す
ると縦書きの場合、左側から読み込んでくれる。縦書きに日本語は右端から読
んでいくのが普通の読み方ですね。これではちょっと都合が悪いので、下記の
文章の上下反対に1つずつ並べなおさないといけない。この程度の長さならば
手動でやっても何とかなるが、もっと文章量の多い場合は困ってしまう。そこ
でChatgptで文章の整形、行順の入れ替えをやることにした。OCRの機能で反対
にできないか?左右反対にして逆の文字(反転しt文字)を出しておいて、1行
ごとに切り取って貼り付けて、右端から順番に文章を並べておいてOCR技術を
使ってテキスト文字を抽出した。これは意外とうまくいった。ただ手間がかか
る。したがって読みは左側からのままChatgptで整形する方法がベストかなと
思います。

OCRは「Optical Character Recognition」の略で、日本語では「光学文字認識
(こうがくもじにんしき)」と読みます。OCR技術は、印刷物や手書きのテキ
ストを画像からコンピュータが読み取り、テキストデータに変換するための技
術です。snipping toolのOCR技術はなかなか優れものです。本格読取り、読み
取り革命はチャンと右端から読んでくれます。ただ読み取り精度がいまいちで
す。それに比べてsnipping toolのOCR技術は精度も良いです。

取り込んだ文章
明智光秀が植えたともいう
一説には亀山城の防御線として
呼ばれるほどであった
ていた その風景は干本松と
防上にみごとな松並木が続い
年谷川 かつてこの両岸の堤
亀山城下町の南東を流れる

「次の文章を一番下の行から順番に上の行に並べ替えてください。行を全部ひ
っくり返して」

千本松(野橋立)跡
「千本松(野橋立)跡」。
「亀山城下町の南東を流れる」。
「年谷川 かつてこの両岸の堤」。
「防上にみごとな松並木が続い」。
「ていた その風景は干本松と」。
「呼ばれるほどであった」。
「一説には亀山城の防御線として」。
「明智光秀が植えたともいう」。

プロンプト「次の文章の間隔を詰めてください。「」は不要です。削除してく
ださい。」

最終的には下記のように並び替えられた。
千本松(野橋立)跡。
亀山城下町の南東を流れる。
年谷川 かつてこの両岸の堤。
防上にみごとな松並木が続い。
ていた その風景は干本松と。
呼ばれるほどであった。
一説には亀山城の防御線として。
明智光秀が植えたともいう。

写真の行を入れ替えたものをOCRで取り込むと。1行ずつ文字を切り取って貼り
付けていく。
すると下記の通りチャンと読み込んでくれました。これは手間暇がかかります。

千本松(野橋立)跡
亀山城下町の南東を流れる
年谷川 かつてこの両岸の堤
防上にみごとな松並木が続い
ていた その風景は千本松と
呼ばれるほどであった
一説には亀山城の防御線として
明智光秀が植えたともいう