これは前にも言った気がするのですが、白紙帳票をプリンタ出力して手書き記入させた後の物をエビデンスとして記録するというブルシット・ジョブ対策で、スキャナにかけた結果 (もしくはカメラ撮影した結果) の画像をいい感じに白紙帳票に重畳してPDFにするツールが欲しい

少なくとも の複合機では と称して、文字の部分と画像(?)の部分とを検出して異解像度・圧縮率で保存する機能はついている (競合他社にも似たような機能はある模様) けど、文字の部分も 圧縮してくれちゃっているし、赤とかのボールペンで記入したのも画像扱いされてしまっているし、おまけに白紙帳票の部分を画像で持つのはデータ量の無駄でしょ

@hadsn こういうこと???Python + OpenCV でそれっぽい画像は作れたw でも画像サイズとか位置合わせとかまで実用的にするのは大変そう……

@kitsune 入力内容は黒色ボールペンのみならず、任意の色の蛍光ペン・赤や青のボールペンも考慮されたい (例がなんで婚姻届けなんですか)

@hadsn なるほどね〜 ならなにかしらのマスクで差分とるよりも切り出しした入力領域の白を透明化するみたいなロジックのがいいのかー…… 実現まで結構複雑なやつだw

@kitsune やってることが帳票OCRの領域なんだよね。キャラクタデータにはしないけど

@hadsn あー、まあ近いかも……?イマドキのOCRよりは力技感が少ないので私の感覚的には違うけど……

フォロー

@kitsune OCRの力技ロジックに流し込む前の段階に、文字が書いてあるだろうボックスを検出したりしない?

@hadsn どうなんだろう……する場合もあるかも?たぶん私はしたくなると思う でもOCRはやったことないんだよな〜

ログインして会話に参加
:realtek:

思考の /dev/null