こんにちは、

データの沼にはまり続けている Silver LifeStyle です。

今回は、「PDFをAIに直接読み込ませて、表をExcel形式やCSV形式に変換する方法」について、具体的なプロンプト例抽出結果をシートにまとめるコツまで、まるで実況中継のようにご紹介します。









PDFから表をExcel形式で抽出




ある日、クライアントから届いた“地獄のPDF”


AIでPDFから表を抽出


話を始める前に、ちょっとしたエピソードから。

先月、とあるクライアントから「このPDFの中の表を全部Excelにしてください」と依頼されました。

そのファイル、70ページ以上ある上に、すべてが複雑な表。手作業では絶対無理…。

でも、私は最近、AIにPDFを読ませる機能があることを知っていたんです。

「よし、これで一気に解決だ!」と思ってやってみたら…意外とハマりました(笑)

今日はそんな私のリアルな経験をもとに、PDFをAIに直接読ませて、表をExcelやCSVに変換する方法を伝授します!




PDFをAIに直接読ませるってどういうこと?


AIにPDFを直接読ませるというのは、AIのモデルにPDFファイルを添付して、その内容を理解・処理させることです。

従来ならOCRで画像化して、テキストに変換して、表にする…という工程が必要でしたが、今ではAI自体がPDF内の構造をある程度理解できるようになってきました。

つまり、PDFをそのままAIに渡すだけで、表の抽出や構造化が可能になったんです。




必要なAIとサービス一覧


以下のようなAIやサービスがPDFを直接読むことができます:

私は、無料のAIしか使っていないのですが、PDFファイルを直接読み込めるAIは増えてきたと思います。

特に、ChatGPTは直接 PDFファイルから表を抽出して、Excel形式で出力することが可能です。

無料版の場合、Excel形式で出力するのに制限があるのですが、私は無料のAIで、 CSV形式で出力して、それをExcelなどで読み込むことで解決しています。

名前 特徴
ChatGPT(有料版) PDF添付可。表の認識力◎
Claude 3(Anthropic) 長文にも強く、表の構造を正確に把握
Gemini Pro(Google) 一部PDF対応。画像解析も得意
Microsoft Copilot(旧Bing Chat) Edgeとの連携で便利
Adobe Acrobat AI Adobe製品特有の精度高め


※無料プランではPDFの添付ができないものもありますので注意してください。




ステップ①:PDFをAIにアップロードする


まずは、使用するAIプラットフォームを開きます。たとえば、ChatGPTの場合:

  • ログイン
  • 「+ New chat」を選択
  • 左下のクリップマークをクリック
  • 抽出したいPDFを選択してアップロード
これで準備完了です!




ステップ②:適切なプロンプトを送る



ここが最も重要。AIに何をしてほしいかを明確かつ丁寧に伝える必要があります。

私が使っている基本プロンプト



「添付のPDFファイル内に含まれるすべての表を抽出し、それぞれをExcel形式の表として表示してください。また、各表のタイトルがあれば、それに合わせて名前をつけてください。」


ChatGPTにPDFを添付して表を抽出


ExcelやCSV形式にしたい場合


「添付のPDFファイル内のすべての表を抽出し、それぞれをCSV形式で表示してください。列名は日本語のまま維持し、各行のデータを正しく整理してください。」


シートごとに分けてほしいとき


「PDF内のすべての表を抽出し、それぞれを別々のシートとして扱うような形式で出力してください。シート名は『表1』『表2』などと自動採番してください。」




ステップ③:抽出結果をシートにまとめる方法


AIが出力するのは通常、テキストベースの表です。これをExcelやGoogleスプレッドシートに移すには、いくつかの工夫が必要です。




方法①:CSV形式で出力→インポート


AIにCSV形式での出力を依頼し、それをダウンロードまたはコピーします。あとは、

  1. Googleスプレッドシート or Excelを開く
  2. 新しいシートを作成
  3. 編集 → 貼り付け(区切り文字あり)

これで簡単にデータ化できます。

フォーマットを整えデータ化した表





方法②:Markdown形式→Excel変換


Markdown形式の表を出力してもらった場合は、以下のように変換できます:

  1. Markdown表をコピー
  2. https://www.tablesgenerator.com/markdown_tables にアクセス
  3. 表を貼り付け → 「Convert table」を選択
  4. 「To CSV」をクリック → コピー
  5. ExcelやGoogleシートに貼り付け




方法③:AIに「複数シート用意してね」と指示する


「このPDFには複数の表があります。それぞれを別のシートとして出力し、シート名は『表1』『表2』とつけてください。形式はCSVでお願いします。」


こうすることで、シートごとにデータが分かれた状態で出力されます。後で整理するのが非常に楽になります。




よくあるトラブルとその回避策


トラブル①:罫線がないとAIが表だと認識しない


これは結構あります。

罫線なしの表は、AIにとって「表かどうかの判断が難しい」んです。

回避策:


「この箇所は表であると仮定して、列ごとに整理してください」


と指示しましょう。

すると、「表っぽいところ」を強制的に表として処理してくれます




トラブル②:列の見出しがない


列名がないと、AIも困ってしまいます。

最終的に人が補う必要もあるんですが、プロンプトでカバーすることも可能です。

回避策:


「列名がない場合は、勝手に『列A』『列B』などの名前をつけてください」


と指示しておくと、一貫性のある列名が自動生成されます。




トラブル③:複数ページにまたがる表


PDFの表が2ページにまたがっていると、AIも途中で途切れてしまうことがあります。

回避策:


「この表は複数ページにまたがっています。全体を通してつながるようにして、一つの表として出力してください」


と指示すると、つながりを意識した表を出力してくれるようになります。




実際に使ってみて感じたこと


正直、最初は「本当にこんなことができるのか?」と半信半疑でした。

でも実際にやってみると、ほぼ完璧に近い結果が出てきてびっくりしました。

ただ、やはりAIなので、完全ではないことも多いです。

だからこそ、「AIに任せつつ、人間が最後チェック+調整する」というスタイルがベストですね。




最後に:私の失敗談(笑)


つい先日、クライアントから「このPDF、全部表だからExcelにしてね!」と言われました。

150ページあります。焦りましたね。

で、早速AIに投げてみたら…なんと半分以上は罫線なしの表だった

AIも困惑気味で「これは表じゃないかもしれません」と返してきました。

「いや、ここは表なんです!!」と心の中で叫びながら、プロンプトを改良して再度チャレンジ。

なんとか形にはなりましたが、やっぱり「AIは万能ではない」って改めて実感しました。




あなたもぜひ試してみてください!


今回の方法、実は誰にでも簡単にできるものです。必要なのは:

  • PC
  • インターネット
  • AIへのアクセス権(有料含む)

たったこれだけで、あなたの仕事が劇的に変わるかもしれません。




この記事があなたの役に立てば幸いです!


もしよかったら、SNSでシェアしていただけると嬉しいです。

そして、何か質問や追加情報があれば、コメント欄にどんどん書いてくださいね!

それでは、また次の記事でお会いしましょう!




*© Silver LifeStyle 生産性向上ブログ*


まとめ:PDF → AI → Excel/CSVはもう夢じゃない!


*まとめ
今回のポイントをおさらいすると:

  • PDFをAIに直接読み込ませることができる
  • 適切なプロンプトを送れば、表を抽出してExcelやCSV形式に変換可能
  • 複数シート形式やCSV形式での出力も可能
  • 多少の誤差はあるが、人の手で微調整すれば十分実用レベル