目的 今回はGoogle DriveniにCSVをアップロードしてGoogleスプレッドシートとして編集してみます。 まず、前提条件として以下のチュートリアルを実行してください。 Google Drive API- Py…
目的 今回はGoogle DriveniにCSVをアップロードしてGoogleスプレッドシートとして編集してみます。 まず、前提条件として以下のチュートリアルを実行してください。 Google Drive API- Py…
はじめに PDFを翻訳する方法は色々あります。 ここでは色々の方法で実験してみます。 今回は以下のPDFを使用して[MS-CFB].pdfを対象にどのような翻訳がされるか確認してみましょう。 MS-CFB.pdf PDF…
はじめに 下記の記事でPyPDF2とreportlabを用いてPDFの点線を実線に置き換える実験を行いました。 PDFの点線を実線におきかえる(PyPDF2 + reportlab) この時、PyPDF2の制限で保存した…
はじめに 以下の記事でcamelotを使用してPDFからテーブルを抽出する場合に、PDFが点線で構成されているとテーブルを旨く認識できない問題を上げました。 ・camelotで点線を実線として処理する この時はcamel…
はじめに camelotではパラメータの調整だけでは点線を含むテーブルの処理が上手く動作しません。 たとえば、以下のようなPDFがそれにあたります。 ➀縦の点線 https://github.com/atlanhq/ca…