2024年05月15日 更新
どうも、クラゲジュニアです。
Microsoftのデジタルノートアプリ「OneNote」の光学文字認識OCR(Optical Character Recognition)がすごかったのでご紹介します!
画像から2クリックで文字列取得が可能ですし、ページ全体について3クリックで音声読み上げが可能です。
※GIFアニメーションです。実際には音声が流れます。
ティッシュペーパーの裏に書いてある文字列を対象画像としました。
左下に書いてある「使用上の注意」の部分を、別途スマホでズーム撮影して画像にしています。
OneNoteに対象文字列の部分だけをトリミングして貼り付けました。
OneNoteに画像を貼り付け後、画像を右クリック > 画像からテキストをコピー
でクリップボードにコピーできます。実際にコピーできた文字列はこちらです。
・においの強い物のそはでの保管は避けてください。
においが移ることがあります。
・ティシューベーバーは水に溶けにくいので、水洗トイレで使用したり
捨てたりしないでください。
・取出しロ等のミシン目を開ける際、ミシン目で指先を傷つける
ことがありますので、こ注意ください。
・専用マグネットバーは磁気力ード等の磁気に弱い物のそばには
近づけないでください。
・クレシア"くつつくん""かけるくん"は火気の近くには
取付けないでください。
そば
がそは
、ペーパー
がベーパー
、くっつくん
がくつつくん
に誤変換された以外は合ってそうです。
OneNoteメニューの表示
> イマーシブリーダー
でウィンドウを立ち上げ、再生アイコンをクリックすると流暢に読み上げてくれます。これは1つの画像だけではなく、ページにある全ての文字列と画像を一気に読み上げます。
漢字の「口」をカタカナの「ロ」と間違えて読み上げるなども発生しましたが、文章を理解する上で致命的な間違いはありませんでした。
画像の解像度が低いとOCRの精度も下がりますので、できるだけ文字が大きく、くっきりするように画像を貼り付けた方が良いです。今回は身の回りにあるものの写真でしたが、紙からスキャンされたPDFやkindleなどの電子書籍でも活用できます。
以上です。