OCRの誤認識

OCRとは、(Optical Character Recognition) 画像文字認識のことである。
e.Typist97 を使って、本をスキャンしたものを認識させてみると
人間が似ていると判断しないものを誤認識する。
しかし、よく見ると似ているので面白い。
特に文字が薄くて切れ切れになると複雑な文字に化ける。

正 → 誤
−−−−−
き → さ
ほ → は
う → ろ
も → む
と → ご
ア → プ
み → 淑
か → 水
が → 哨
が → 郁
が → 那
が → 邪
ま → 立
な → 公
れ → 払
を → 与
石 → ろ
局 → ろ
込 → た
少 → グ
万 → 月
有 → 存
多 → 冬
女 → 久
者 → 音
年 → 隼
達 → 違
言 → 盲
偉 → 揮
子 → 不
子 → 千
手 → 子
四 → 回
騙 → 蛎
愚 → 恩
碁 → 暮
事 → 享
局 → 筍
相 → 棺
得 → 傷
時 → 晴
数 → 敬
庵 → 春
優 → 侵
優 → 役
勢 → 努
隅 → 限
借 → 惜
騙 → 蛎
敵 → 赦
見 → 乱
達 → 違
妙 → 砂

フューチャー・ホームページへ戻る

(C)2004 Future on netyou ALL RIGHTS RESERVED.