フォロー

これは前にも言った気がするのですが、白紙帳票をプリンタ出力して手書き記入させた後の物をエビデンスとして記録するというブルシット・ジョブ対策で、スキャナにかけた結果 (もしくはカメラ撮影した結果) の画像をいい感じに白紙帳票に重畳してPDFにするツールが欲しい

少なくとも の複合機では と称して、文字の部分と画像(?)の部分とを検出して異解像度・圧縮率で保存する機能はついている (競合他社にも似たような機能はある模様) けど、文字の部分も 圧縮してくれちゃっているし、赤とかのボールペンで記入したのも画像扱いされてしまっているし、おまけに白紙帳票の部分を画像で持つのはデータ量の無駄でしょ

@hadsn こういうこと???Python + OpenCV でそれっぽい画像は作れたw でも画像サイズとか位置合わせとかまで実用的にするのは大変そう……

@kitsune 入力内容は黒色ボールペンのみならず、任意の色の蛍光ペン・赤や青のボールペンも考慮されたい (例がなんで婚姻届けなんですか)

@kitsune 当然記載済みデータはスキャナ通過時のノイズや回転があり、PDFから印刷の際の拡大縮小などもあるので地獄と言えば地獄である

@hadsn ノイズとか回転とかサイズの拡大縮小は解決するアルゴリズムあるけど、色ペンが一番たいへんかも…… あ、例が婚姻届なのは……言わせんな恥ずかしい♡ってやつです、えへへ

@hadsn たぶん マスク作る→マスクから輪郭抽出してポリゴン化→入力領域に該当するポリゴンを設定(ある程度半自動で判別はできるはず)→マスクの全体ポリゴンから記載済みの書類との特徴量マッチングして対応付→対応付した領域から入力領域に該当するポリゴンの部位のみ抜き出し→抜き出した画像から白を色抜き処理→得られた色抜き画像を入力領域ポリゴンにフィットするように変形してレイヤー生成 みたいな流れかな〜!複雑!!

@kitsune まあ一番簡単にできそうなのは、地色検出とその地色の部分は画像で符号化しないってところですかね?

@hadsn あー、まあそれもありかも……???あとなんかさみしくて頭がぼんやりしてきた……くっつきたい……

@hadsn なるほどね〜 ならなにかしらのマスクで差分とるよりも切り出しした入力領域の白を透明化するみたいなロジックのがいいのかー…… 実現まで結構複雑なやつだw

@kitsune やってることが帳票OCRの領域なんだよね。キャラクタデータにはしないけど

@hadsn あー、まあ近いかも……?イマドキのOCRよりは力技感が少ないので私の感覚的には違うけど……

@hadsn あとさみしい……かまちょ〜……肌質が終わりだし家から出たくないけどかまってほしい……(

@kitsune OCRの力技ロジックに流し込む前の段階に、文字が書いてあるだろうボックスを検出したりしない?

@hadsn どうなんだろう……する場合もあるかも?たぶん私はしたくなると思う でもOCRはやったことないんだよな〜

ログインして会話に参加
:realtek:

思考の /dev/null