はじめに 下記の記事でPyPDF2とreportlabを用いてPDFの点線を実線に置き換える実験を行いました。 PDFの点線を実線におきかえる(PyPDF2 + reportlab) この時、PyPDF2の制限で保存した…
はじめに 下記の記事でPyPDF2とreportlabを用いてPDFの点線を実線に置き換える実験を行いました。 PDFの点線を実線におきかえる(PyPDF2 + reportlab) この時、PyPDF2の制限で保存した…
はじめに 以下の記事でcamelotを使用してPDFからテーブルを抽出する場合に、PDFが点線で構成されているとテーブルを旨く認識できない問題を上げました。 ・camelotで点線を実線として処理する この時はcamel…
はじめに camelotではパラメータの調整だけでは点線を含むテーブルの処理が上手く動作しません。 たとえば、以下のようなPDFがそれにあたります。 ➀縦の点線 https://github.com/atlanhq/ca…
目的 政府がオープンデータを叫び出して何年かが過ぎましたが、多くの政府が公開するデータはPDFベースになっています。 さすがにひと昔前のように紙をスキャンしただけのデータではなくなりましたがCSVやJSONなどの機械的に…
目的 はてなブックマークをREST API経由で登録してみます。 環境は以下の通りです。 ・windows 10 ・python 3.7.4 はてなブックマークのREST APIについては下記を参照してください。 htt…
手順 (1)publis.twitter.comにアクセスする https://publish.twitter.com/# (2)埋め込みたいタイムラインのURLを入力 (3)「 Embedded Timeline 」を…