ITエンジニア/デザイナ向けにオープンソースを毎日紹介

画像から情報を取り出すのは面倒です。テキストならばコピー&ペーストできるのに、画像の場合は目で見ながら書き写したりします。同じコンピュータ上の画面でそんなことをやるのはアホくさいと思ってしまうでしょう。

そこで使ってみたいのがimage2csvです。グリッド上に並んだデータをCSVに取り出します。

image2csvの使い方

元画像。

CSVとして取り出したデータ。

image2csvはTesseractでOCRを行っています。その結果をCSVとして展開しています。試した限りでは精度はあまり高く見えませんが、データの形式によるところも大きそうです。

image2csvはPython製のオープンソース・ソフトウェア(MIT License)です。

artperrin/image2csv: Convert tables stored as images to an usable .csv file

 

MOONGIFTの関連記事

  • DevRel
  • Com2