WindowsでPDFをスキャンしてテキストを抽出する方法

WindowsでPDFをスキャンしてテキストを抽出する方法

PDFファイルのテキストは選択できればコピー&ペーストが可能ですが、選択できない場合はWindows 11でアプリの【Snipping Tool】や【フォト】を使うと画像から文字を認識して文字起こしできます。

テキストを選択できない

PDFファイル内のテキストは、一般的なテキストファイルなどと同様に選択してコピーできるようになっていますが、「保護されている」「画像データになっている」と言った場合は選択できないことがあります。
Windows 11→Microsoft Edge→PDF→テキスト→選択

このようなPDFからテキストを抽出したい場合、Windows 11ではSnipping Toolアプリを使ってPDFファイルをスクリーンショットを撮り、テキストアクションを実行して文字起こしするのが簡単です。

また、あらかじめ画像データに変換すればフォトアプリを使っても同様のことができます。

Snipping Toolで“テキストのスキャン”をする手順

PDFファイルを画面に表示します。
Windows 11→Microsoft Edge→PDF

スクリーンショットを撮る操作はSnipping Toolアプリより行います。

スクリーンショットを撮る

画面下の>すべてなどからSnipping Toolを起動します。
Windows 11→スタートメニュー→すべて

Snipping Toolより+新規をクリックします。
Windows 11→Snipping Tool

Snipping Toolの切り取り領域よりウィンドウをクリックします。
Windows 11→Snipping Tool→アイコン→切り取り領域

Windows 11→Snipping Tool→切り取り領域

PDFファイルのウィンドをクリックします。
Windows 11→Microsoft Edge→PDF

テキストアクションで選択しコピーする

Snipping Toolよりテキストアクションをクリックします。
Windows 11→Snipping Tool→テキストアクション

スキャンされたテキストを選択しコピーします。

選択したところを右クリックしテキストをコピーするをクリックするか、キーボードよりCtrlCキーでコピーできます。

Windows 11→Snipping Tool→テキストアクション→選択

Snipping Toolで“テキストのスキャン”をするやり方は以上です。